Presýtené RSS – dá sa ísť ďalej?

od autora: rony · 19. septembra 2006

Určite poznáte weby, ktoré to s produkovaním článkov, príspevkov a informácií preháňajú, čo samozrejme každý posudzuje s inou mierou. Produkujú nie jednu, dve správy denne ale desať alebo aj viac.
Svoj vplyv to má najmä na RSS kanály. Pokiaľ sledujete iba ten jeden jediný web, tak Vám nijako nepríde, že je toho priveľa. Sledujte ich ale dvesto. Alebo majte prihlásený odber katalógového RSS akým je napr. blogportal.hlava.net a tam zistíte, aký je nepomer v produkcií jednotlivých webov. Jeden menej zaujímavý zdroj vyprodukuje za deň pár desiatok položiek a ďalších 50 maximálne jednu.
V prípade, že začnete prírastky cez RSS kanály považovať za nadprodukciu, ktorú nestíhate sledovať, dochádza k prehlteniu množstvom informácií a tento problém je nutné nejakým spôsobom riešiť.

Pomôct by mohli rôzne spôsoby združovania podobných informácií podľa rôznych kritérií.
V prípade katalógových zdrojov, kedy jediným RSS kanálom prúdia dáta z rôznych webov by bolo možné riešiť tento problém úpravou algoritmu zaraďovania položiek do jeho RSS kanála. Kritéria môžu byť všelijaké, napr.
* algoritmus katalógového zdroja sa môže rozhodnúť, že u zdrojov s istým počtom nových položiek ich nezaradí po jednej ale združí ich do jedinej – po otvorení takejto položky sa zobrazí stránka s ich zoznamom. Alebo si to zjednoduší a nezaradí všetky nové položky tohto webu,
* úpravou správania čítačiek, ktoré by vedeli napr. podľa URL adresy združovať položky z rovnakého zdroja a zobraziť ich ako „otvárateľnú“ podzložku,
* virtuálne zložky, kde si používateľ určí kritéria pre filtrovania a takého vyhľadávanie si uloží po vzore nového Outlooku – čiže čítačka bude tieto virtuálne zložky/zdroje zobrazovať „akože“ zdroj ale nie fyzický ale sem bude zaraďovať (alebo nezaraďovať) položky, ktoré vyhovejú zadaným kritériam. Príklad – z blogportálu chcem vylúčiť nezaujímavý a nadproduktívny web – tak zadám podmienku aby položky so zadanou časťou URI „vyhadzoval“.
* sofistikovanejšie algoritmy katalógov, ktoré by vedeli „odhadovať“ príbuzné zameranie položiek (článkov) podľa obsahu nadpisu, popisu a združovali ich do jedinej položky vždy s odkazom, že téme sa venujú ešte tieto a tieto weby (v týchto a týchto článkoch).
Princíp je teda v tom, že sa miesto zoznamu niekoľkých desiatok položiek zobrazí štruktúra, v ktorej sa podľa nejakých súvislostí *združia podobné položky.*
Keď s niečím takýmto neprídu služby ako je digg, linkuj.cz, asdf.sk, blogportal.hlava.net, weblogy.sk a podobné „agregátory“, tak zrejme dorazíme asi takto: kým to pôjde, potom to zmrazíme a budeme „vyvíjať“ a potom najskôr nič nevymyslíme. Ale v informačnom pretlaku to nie je tak, že v ňom žijeme alebo nežijeme. Proste pomaly narastá.

Môže sa Vám ešte páčiť...

11 komentárov

Komentáre11
Téma Hueman vyžaduje nasledujúce pluginy:0

Tibor píše:

19. septembra 2006 o 18.56

Zaujímavý nápad – triediť a spracúvať obsah RSS kanálov, to by stálo za to rozbehnúť…
dusoft píše:

19. septembra 2006 o 22.35

Dalej sa da ist mazanim kanalov, ktore prispievaju k sumu a prinasaju desatkrat prezuty obsah.
Ruziklan píše:

19. septembra 2006 o 22.59

Riesim to manualne. V zozname novych RSS zaznamov (napr. z Blogportalu) si dam vyhladat vsetky obsahujuce retazec charakterizujuci dany nehodnotny RSS a zmazem ich jednym smahom. Na prezretie mi toho zostane menej.
Iste, nie je to nic sofistikovane, nejaka automatizacia by sa hodila.
rony píše:

20. septembra 2006 o 09.47

[2] ano ale to je represivne :-) mne to samozrejme pripomina tapetoanie ak niekto na svojom webe produkuje desiatky poloziek denne a posiela ich do blogportalu. ukracuje tym miesto ostatnym, kedze blogportal je obmedzeny poctom poloziek v jeho RSS ale to je uz subjektivny pocit – tapetovanie posudzujeme aj subjektivne, nielen objektivne. Napr. ten co tapetuje to vidi vyhradne pozitivne :-)
[3] to nejde – tym si nuteny urobit nejaky ukon pricom tapetujuci ti neustale pridava nove a nove polozky. To je ako so spamom – ak je ho 10 percent z celej posty, tak mazes. Ak je to 90 percent, tak ta serie.
rony píše:

20. septembra 2006 o 09.50

aby bolo jasne, nejde mi prvoplanovo o tapetovanie.
skor o spajanie – zdruzovanie podla kriterii:
– zdroj
– tema
dusoft píše:

20. septembra 2006 o 12.37

Technorati ale napr. taketo vybery ma, ci nie?
rony píše:

20. septembra 2006 o 13.21

[6] ten som nikdy nepouzival. Navyse tam nie je kazdy zdroj o ktory by som stal a prilis vela tych, ktore nemozem sledovat (napr. anglofonne urcite nie).
dusoft píše:

21. septembra 2006 o 23.03

OK – to ma len napadlo, ze oni robia de facto vyber.
rony píše:

21. septembra 2006 o 23.09

[8] ved ano, mne sa principialne paci sposob zobrazovania Google News. Pokial by to bolo prepojene podobne ako nedavno pisal Kryl o http://spotback.com/ – mimochodom to je nastroj, ktory ma toho strasne vela a viditelne reaguje na tvoje zmeny v preferenciach – to niektorym podobnym webom chyba – napr. asdf.sk sa javi ako neinteraktivna sluzba a tu robi celkom chybu – mala by klast vacsi doraz na to, ze nie je iba puhym vyberom clankov.
dusoft píše:

22. septembra 2006 o 00.08

Suhlasim, to si uz ale vyzaduje ist nad ramec zberu RSS ci noviniek od uzivatelov. Napr. algoritmus, bayesiansky system a pod.
rony píše:

22. septembra 2006 o 20.13

[10] áno, je tu stovka schopných ľudí, ktorí sa zakopávaniu programovaním dokola toho istého. Už sa teším, že ďalší mainstreamový produkt už nevznikne zosekaním anglofónnych vzorov.

Presýtené RSS – dá sa ísť ďalej?

Môže sa Vám ešte páčiť...

Moje hranie sa s mod-rewrite je ako dráždenie šelmy

Najlepší je Misantropův zápisník

Prečo sa v zákazkach na weby točia tí istí a Vy nie?

11 komentárov

Témy

TAGY