Štve vás bordel v html z Wordu?

Veľmi pekný a výkonný konvertor z Wordu do všetkého možného, navyše typicky konfigurovateľný. Môžete si u html výstupu napríklad sami určiť čo sa má za aké tagy nahradzovať, takže vaše DOCy môžu po skonvertovaní mať takú štruktúru akú potrebujete (napríklad html dokument bez hlavičiek, pre priame vloženie do CMS), resp. dokonca výstup vybavený tými divnými IDčkami a CLASSmi priamo pre váš CSS súbor.
Ktorý program to takto zvláda? Predsa wvWare.
Čo som s ním vyviedol ja? Napríklad mailové konvertítko: pošlete na mailovú adresu konvertítka mail s prílohou vo formáte DOC. V /etc/aliases mám na túto adresu zavesený skript, ktorý rozbalí mail, vykopíruje si adresu odosielateľa, prílohy. Preženie to cez wvWare (s mojou šablónou pre prevod) a odošle naspäť na adresu odosielateľa. Jemu príde HTML súbor s obrázkami, ktoré sú v dokumente vložené presne tak ako v pôvodnom DOC.
Za zaujímavý pokladám aj PHP skript (fuj, trošku dehonestujúce slovo) s názvom tag|wall, ktorý zasa robí filtrovanie a čistenie (demoroniser) html kódu. Odstránite v ňom spoľahlivo už v default nastavení všetok bordel, ktorý vyrobí Word pri uložení DOC do html (aj OpenOffice má trošku ukecaný kód). Ostanú tam len základné značky a výsledok je už konečne použiteľný pri vkladaní do vašich CMS systémov a publikovanie na WEB. Takisto tagwall je výhodné použiť na všetky texty vložené cez obľúbené HTML editory (viete, že Ctrl-C narobí strašný bordel v kóde..). Na tagwall vám url neposkytnem, nenašiel som.

Written by rony

3 komentáre

potapnik

Ja na vkladani textu „balast out of MS Word“ do CMS mam wysiwyg fck-editor. Link nemam, pres google se to najde v pohode.

rony

ano FCK poznam, ten uz ma integrovany filter.
wvWare ma zasa mozne nasadenie prave v systemoch ked chces napriklad davkovo konvertovat hotove DOC subory, proste usetrit si cestu:
spustit Office, Copy, FCKEditor: Paste, Save
Navyse wv nepotrebuje ziadny Office – pracuje sam od seba ;-)

Comments are closed.