Varovanie: RSS zdroje z blogov na SME sú priveľké

Minulý rok na jeseň najmä na conBlogu prebehli debaty o možných problémoch s rozširovaním technológie RSS. Jedným z dôsledkov totiž môže byť záťaž na prenosové kapacity sťahovaním RSS kanálov zo serverov a za hlavnou prioritou sa už nestavá evanjelizácia tejto technológie ale skôr jej optimalizácia.
Preto sa stanovili problematické okruhy: čítačky by nemali načítavať zdroje príliš často. Zhodli sme sa na defaultnom intervale 60 minút ako prednastavenú hodnotu v čítačkách. Ďalšia vec je objem sťahovaných dát. S tým súvisí počet položiek v RSS súbore – aj štandard spomína počty do 15 items. Zdroje, ktoré obsahujú napríklad kompletné texty článkov resp. príliš dlhé descriptions by mali ich prevádzkovatelia optimalizovať a prispôsobiť ich veľkosť istým limitom.
Ďalšími okruhmi boli napríklad rozdiely medzi statickým RSS a dynamicky generovaným, kedy sa skôr doporučuje generovať obsah RSS iba pri zmene obsahu websajtu a nie online „z databáz“. Potom rôzne techniky server-cache ako aj tlak na cache mechanizmy v RSS čítačkách, či umožnenie cacheovaina RSS zdrojov firemnými cache mechanizmami. Vyššie formáty RSS umožňujú v hlavičke zápisy dátumov poslednej modifikácie obsahu a niektorí producenti RSS si to mýlia s aktuálnym časom, čo spôsobuje neustále obnovovanie „timestampu“ RSS zdrojov, čím sa môžu niektoré agregátory spliesť a považovať obsah zdroja za obnovovaný pri každom stiahnutí.
Pár dní pozorujem, že blogy na SME sa rozhodli svoje zdroje poskytovať s počtom item na niekoľko desiatok: 80 kusov je fakt hodne moc. Takže, pokiaľ odoberáte zdroje RSS SME, tak si dajte pozor – čítačky to väčšinou neohlásia explicitne ale na záťaži linky to už časom spoznáte. Predpokladám, že sa blogy na SME rozhodnú nepretláčať do takýchto technológií zbytočne svoje videnie a tlaky „niektorých čitateľov“ na zvýšenie počtu položiek či iné „obohacovanie“ existujúcich technológií nebudú robiť kontraproduktívne :-)
Nič v zlom samozrejme.

Written by rony