- Office HTML
- 22.10.03 11:21
-
Vakar tika uzdots jautājums. Diemžēl lielākā daļa no komentāru autoriem neiespringa uztvert to faktu, ka man šis process ir jāveic automatizēti.
Tad nu minēšu vēlreiz. Man ir lietotājs. Kurš caur lapas administrāciju baro iekšā tekstus. Visbiežāk jamais tos raksta Wordā un tad ar copy/paste metodi ievieto attiecīgajā MSHTML vai MIDAS enablētā teksta laukā.
Pēc daudzstundu ņemtnes izdevās panākt vēlamo efektu. Process ir sekojošs:
- Lietotājs iepeisto savu Worda brīnumtekstu iekš to teksta ievades lauku.
- Ar PHP līdzekļiem es šajā tekstā veicu nepieciešamās substitūcijas -
font color="..."
aizvietoju arspan style="color: ..."
, u.t.t. - Ar PHP līdzekļiem (
strip_tags()
) es šo tekstu iztīru no liekajiem (sliktajiem) tagiem. - Esmu ieguvis puslīdz smuku kodu, ja neskaita to, ka tajā esošie atverošie/aizverošie tagi neprotās. Te nu es talkā ņem HTML Tidy. iebarojot šamajai programmai nepieciešamos parametrus un savu pusattīrīto failu, ļauju tai pabeigt cēlo darbu.
- No HTML Tidy rezultāta paņemam tikai to, kas ir starp
<html>
un</html>
.
Finālā mēs iegūstam tiešām korektu XHTML kodu. Notestēju ar dažādiem testa dokumentiem gan no Word, gan no Excel, gan ar tabulām, gan bez tām, gan ar visādiem embedotiem objektiem, u.t.t. Strādā.
Taču, pazīstot lietotājus (kā sugu), domāju, ka jamie atradīs ne vienu vien nepilnību šajā implementācijā.