CMS 3.: Interpunkčné znamienka I.

Podiel typografických prehreškov v dodávaných textov je výrazný aj u písaní interpunkcie. Okrem gramatických chýb je to najmä správne umiestňovanie medzier.


Našťastie sú v drvivej väčšine všetky pravidlá pre uvádzanie medzier pri použití znamienok ľahko naprogramovateľné vo forme jednoduchých filtrov.

Môj staručký Typografický editor okrem problému s medzerami riešil ako svoju druhú veľkú úlohu práve interpunkčné znamienka. Vtedy som vedel, že znamienka ako je čiarka, bodkočiarka, bodka sa vždy píšu s medzerou za znamienkom a nikdy nesmú mať pred sebou medzeru. Výnimkou boli čísla s desatinnou čiarkou. Preto používateľ môjho editora mohol mať kľudne divoké návyky vkladania medzier rôznymi spôsobmi. Program totiž na stlačenie medzerníka reagoval v kontexte s okolitými znakmi v texte. Pokiaľ teda klepol na čiarku tesne za medzerou, odstránil medzeru a znamienko sa vložilo za posledný neprázdny znak. Po čiarke mala byť medzera, takže či ju vložil alebo rovno pokračoval nejakým znakom – medzera sa automaticky do textu doplnila. Problém s číslami a desatinnou čiarkou som vyriešil tak, že program nespúšťal filtrovanie vždy a bolo možné prípadnú automaticky vkladanú medzeru vymazať ale len v prípade, keď predošlý a nasledujúci znak bola číslica. Myslím si, že takto riešené správanie sa editora vyhovelo pravidlám a zároveň som nenútil používateľa neustálym otravovaním – nechal som ho písať ako vie. Len hneď videl, že sa editor nenásilne vzpiera.

Vo webovom CMS musíme zmeniť taktiku. Text prijíma systém už prakticky dokončený a musíme ho príslušným skriptom pre opravy prejsť celý. Naše nahradzovacie pravidlo teda bude vyhľadávať interpunkciu a pokiaľ nenájde pred znamienkom neprázdny znak, všetky medzery (tabulátory a iné nezobrazované znaky) vymaže. Potom zistí, či za znamienkom je prázdny znak medzery. Pokiaľ nie je, vloží ho.
Tak ako mňa vás asi napadlo, že medzier je predsa viacej druhov. Tu by však nemal byť žiadny problém, pretože u jednopísmenných spojok sa zrejme nikdy nevyskytne interpunkčné znamienko. Neviem si spomenúť na nejakú výnimku.
Namiesto bodky ako ukončovania vety samozrejme rovnako platia pravidlá pre otáznik, výkričník, tri bodky a pod. Preto tieto znaky považujeme za rovnocenné ukončenia viet s rovnakým prístupom ako čiarka, bodkočiarka a pod.
Zložitejšie sú pravidlá pre písanie párovej interpunkcie – zátvorky a uvodzovky.
Kým pravé ukončenie má presne tie isté pravidlá ako má napríklad čiarka, u ľavého ukončenia je to presne naopak: pred ľavou zátvorkou medzera byť musí a za ňou byť nesmie.
Ľudia odškolení mechanickými strojmi vkladajú namiesto zátvoriek lomítka, čo je nesmierne zlý zlozvyk. Proti nemu sa totiž ťažko niečo dá urobiť – vypracovanie funkčného filtra je obťiažne.
Úvodzovky k sebe priberajú ešte počítačový zvyk vkladania dvojitých horných uvodzoviek priamo z klávesnice. Tento zvyk je pochopiteľný – iné úvodzovky na klávesnici vlastne nie sú. Pokiaľ text má uvodzovky dobre spárované môžeme jednoducho každú párnu uvodzovku vymeniť za správnu pravú uvodzovku a nepárne za ľavú.
Pri programovaní je vhodné zobrať do úvahy vnorenie úvodzoviek, čo nie je v bežných textoch na webe zasa príliš častý jav.
Správne úvodzovky sa píšu ako entity:
dolné dvojité uvodzovky: bdquo
horné dvojité uvodzovky: ldquo
Pre vnorenie sa ešte dajú použiť jednoduché:
dolné uvodzovky: sbquo
horné uvodzovky: rsquo
Isto vieme, že viacej interpunkčných znamienok za sebou sa príliš nepoužíva a preto do filtra textu zahrňme aj opravovanie týchto chybných zápisov. Výnimkou je použitie otáznikov a výkričníkov. Tieto môžu byť vložené dva a viacejkrát za tesne sebou.
U bodiek nahrádzajte filtrom dve a viac bodiek entitou hellip. Iný počet ako tri bodky totiž nie je správny.


Zhrnutie článkov na tému CMS do 21. mája 2004:

Written by rony