CMS I.: medzery v texte

Motto: Text602 vykonala v návykoch používateľov veľa zlého
Pokiaľ občas dostávate podklady na spracovanie od pána Bloody F., zrejme sa nevyhnete medzierkovým problémom. Medzery sú v texte príliš často na nesprávnych miestach a príliš často opakovane. Medzery sú zároveň nevhodným stavebným prvkom tabuliek, odsadení odstavcov a ďalších umeleckých dielok v dodanom texte.
Veľmi podobne sa správa aj obsluha systémov správy obsahu a to nevynímajúc kohokoľvek bez precíznejšieho povedomia o typografií či logike elektronických nástrojov pre prípravu textu či DTP systémov.
Na rovinu musíme priznať, že napriek tomu, že v elektronickom publikovaní (ale aj „špinavej“ typografií) sa vyskytujú tri či viac typov medzier, rutinne používame najčastejšie jednu a tí väčši profíci možno aj dve.


Vymenujme si teda aké sú tie medzery:
bežná – klepnite na medzerník a to je ona,
zúžená – v HTML je to entita thinsp a používa sa všade, kde je bežná medzera príliš široká: oddelenie cifier a pod. (presný výklad je v literatúre),
nezalomiteľná – nespôsobuje v texte vznik nesprávne rozdelených riadkov pri nalievaní textu do boxov, ak vložíme medzi dve slová túto medzeru, budú tieto vždy v jednom riadku. Problémy nastávajú v príliš úzkych stĺpcoch.

Pred dlhými rokmi som bol nešťastný z textov, ktoré mi pripravovali vo firme pre zlom (DTP). Ako bývalý nadšený Pascalista som oprášil Turbo Vision a upravil jeden sample textový editor s tým, že mal niektoré inteligentné vlastnosti.
V prvom rade som chcel eliminovať medzierkový problém. Penil som nad dvomi, či tromi medzerami za sebou, pretože sa to pri odvšivovaní v DTP programe dalo ľahko prehliadnuť. Môj editor proste neumožnil vložiť do textu viac ako jednu medzeru. Proste nereagoval, keď ste klepli na medzerník a pred kurzorom už medzera bola. Zároveň neumožnil ani vložiť medzeru na začiatok riadka (ani zlomeného v odstavci).
Veľmi dobrá vec. Dodnes nerozumiem, prečo istý Word inteligentne nahradzuje odrážky ale takéto niečo nerobí..

Problémom webových CMS je fakt, že vo formulárových poliach si nemôžete ovplyvňovať vlastnosti editora textu (a to ani bežného TEXTAREA alebo aj komfortného HTMLAREA). Preto je jediným riešením nasadenie filtrov až po odoslaní textu. Nemusím zdôrazňovať, že je to maximálne neužívateľsky nekomfortné. Chýba tomu prvok „výchovy“.
Zmierme sa s tým a vyriešme to aspoň filtrom. V HTML máme jednu zásadnú výhodu a to v tom, že viac medzier za sebou má v kóde význam jedinej a prehliadače ich aj ako jedinú zobrazujú. Iná vec je „osobný“ pocit šetrenia bajtami a fakt, že nahradenie dvoch medzier jedinou nie je až také komplikované.
Opakujme nad celým textom tieto kroky:
1. nahraď dve za sebou idúce medzery jednou medzerou,
2. Pokiaľ si vykonal jedno alebo viac nahradení, prejdi na prvý krok.
* jasne, regulárny výraz je lepší ako tento prístup programátora v Basicu
Tento krok bol veľmi ľahučký, však. Následne sa budem zaoberať algoritmizáciou typografických prehreškov v súvislosti s rôznymi typmi medzier a limitami takéhoto riešenia.
Zdroj: einstein.cz a papierová literatúra k typografií.
Nečiním si nároky na absolútnu typografickú presnosť obsahu ani prevedenia. Sám neviem, čo bude nabudúce, preto komentujte/linkujte – to je tá živá voda ;-)


Zhrnutie článkov na tému CMS do 21. mája 2004:

Môže sa Vám ešte páčiť...

2 komentáre

  1. Piki píše:

    Minule som písal, že dlhšie články píšeš výborne. Len tak ďalej. Alebo, že by to nezáviselo na dĺžke článku? :-)

  2. rony píše:

    nechcem citit povinnost pisat dlhsie veci.
    okrem toho treba vediet, ze to pisem bez kontrolovania, proste napisem to a publikujem. nie je to teda nic, co by podla mna malo hlavu a patu :-) ked zacnem pisat neviem aky to bude mat koniec ;-)