19. september 2006 16.00 WEB

Presýtené RSS - dá sa ísť ďalej?

Určite poznáte weby, ktoré to s produkovaním článkov, príspevkov a informácií preháňajú, čo samozrejme každý posudzuje s inou mierou. Produkujú nie jednu, dve správy denne ale desať alebo aj viac.

Svoj vplyv to má najmä na RSS kanály. Pokiaľ sledujete iba ten jeden jediný web, tak Vám nijako nepríde, že je toho priveľa. Sledujte ich ale dvesto. Alebo majte prihlásený odber katalógového RSS akým je napr. blogportal.hlava.net a tam zistíte, aký je nepomer v produkcií jednotlivých webov. Jeden menej zaujímavý zdroj vyprodukuje za deň pár desiatok položiek a ďalších 50 maximálne jednu.

V prípade, že začnete prírastky cez RSS kanály považovať za nadprodukciu, ktorú nestíhate sledovať, dochádza k prehlteniu množstvom informácií a tento problém je nutné nejakým spôsobom riešiť.

Pomôct by mohli rôzne spôsoby združovania podobných informácií podľa rôznych kritérií.

V prípade katalógových zdrojov, kedy jediným RSS kanálom prúdia dáta z rôznych webov by bolo možné riešiť tento problém úpravou algoritmu zaraďovania položiek do jeho RSS kanála. Kritéria môžu byť všelijaké, napr.

  • algoritmus katalógového zdroja sa môže rozhodnúť, že u zdrojov s istým počtom nových položiek ich nezaradí po jednej ale združí ich do jedinej - po otvorení takejto položky sa zobrazí stránka s ich zoznamom. Alebo si to zjednoduší a nezaradí všetky nové položky tohto webu,
  • úpravou správania čítačiek, ktoré by vedeli napr. podľa URL adresy združovať položky z rovnakého zdroja a zobraziť ich ako "otvárateľnú" podzložku,
  • virtuálne zložky, kde si používateľ určí kritéria pre filtrovania a takého vyhľadávanie si uloží po vzore nového Outlooku - čiže čítačka bude tieto virtuálne zložky/zdroje zobrazovať "akože" zdroj ale nie fyzický ale sem bude zaraďovať (alebo nezaraďovať) položky, ktoré vyhovejú zadaným kritériam. Príklad - z blogportálu chcem vylúčiť nezaujímavý a nadproduktívny web - tak zadám podmienku aby položky so zadanou časťou URI "vyhadzoval".
  • sofistikovanejšie algoritmy katalógov, ktoré by vedeli "odhadovať" príbuzné zameranie položiek (článkov) podľa obsahu nadpisu, popisu a združovali ich do jedinej položky vždy s odkazom, že téme sa venujú ešte tieto a tieto weby (v týchto a týchto článkoch).

Princíp je teda v tom, že sa miesto zoznamu niekoľkých desiatok položiek zobrazí štruktúra, v ktorej sa podľa nejakých súvislostí združia podobné položky.

Keď s niečím takýmto neprídu služby ako je digg, linkuj.cz, asdf.sk, blogportal.hlava.net, weblogy.sk a podobné "agregátory", tak zrejme dorazíme asi takto: kým to pôjde, potom to zmrazíme a budeme "vyvíjať" a potom najskôr nič nevymyslíme. Ale v informačnom pretlaku to nie je tak, že v ňom žijeme alebo nežijeme. Proste pomaly narastá.

Pokiaľ sa ti zdá, že tento článok by sa hodil do výberu zaujímavých stránok, tak ho sme.sk pošli do vybrali.sme.sk

Komentáre k obsahu príspevku:

Chcete napísať nesúhlasný komentár? Prosím, zvážte nasledovné: je šanca, aby niekto zmenil Váš názor alebo chcete iba trvať na svojom? V prvom prípade sú Vaše slová vítané.

Chcete urážať? Nepíšte sem urážky a invektívy. Každý, kto na týchto stránkach publikuje je automaticky (doplňte vhodný výraz). Takže už to všetci vopred vieme, čo si myslíte a preto sa neopakujte.

  1. [1] Tibor, 19. september 2006 18.56

    Zaujímavý nápad - triediť a spracúvať obsah RSS kanálov, to by stálo za to rozbehnúť...

  2. [2] dusoft, 19. september 2006 22.35

    Dalej sa da ist mazanim kanalov, ktore prispievaju k sumu a prinasaju desatkrat prezuty obsah.

  3. [3] Ruziklan, 19. september 2006 22.59

    Riesim to manualne. V zozname novych RSS zaznamov (napr. z Blogportalu) si dam vyhladat vsetky obsahujuce retazec charakterizujuci dany nehodnotny RSS a zmazem ich jednym smahom. Na prezretie mi toho zostane menej.
    Iste, nie je to nic sofistikovane, nejaka automatizacia by sa hodila.

  4. [4] rony, 20. september 2006 09.47

    [2] ano ale to je represivne :-) mne to samozrejme pripomina tapetoanie ak niekto na svojom webe produkuje desiatky poloziek denne a posiela ich do blogportalu. ukracuje tym miesto ostatnym, kedze blogportal je obmedzeny poctom poloziek v jeho RSS ale to je uz subjektivny pocit - tapetovanie posudzujeme aj subjektivne, nielen objektivne. Napr. ten co tapetuje to vidi vyhradne pozitivne :-)

    [3] to nejde - tym si nuteny urobit nejaky ukon pricom tapetujuci ti neustale pridava nove a nove polozky. To je ako so spamom - ak je ho 10 percent z celej posty, tak mazes. Ak je to 90 percent, tak ta serie.

  5. [5] rony, 20. september 2006 09.50

    aby bolo jasne, nejde mi prvoplanovo o tapetovanie.

    skor o spajanie - zdruzovanie podla kriterii:

    - zdroj
    - tema

  6. [6] dusoft, 20. september 2006 12.37

    Technorati ale napr. taketo vybery ma, ci nie?

  7. [7] rony, 20. september 2006 13.21

    [6] ten som nikdy nepouzival. Navyse tam nie je kazdy zdroj o ktory by som stal a prilis vela tych, ktore nemozem sledovat (napr. anglofonne urcite nie).

  8. [8] dusoft, 21. september 2006 23.03

    OK - to ma len napadlo, ze oni robia de facto vyber.

  9. [9] rony, 21. september 2006 23.09

    [8] ved ano, mne sa principialne paci sposob zobrazovania Google News. Pokial by to bolo prepojene podobne ako nedavno pisal Kryl o http://spotback.com/ - mimochodom to je nastroj, ktory ma toho strasne vela a viditelne reaguje na tvoje zmeny v preferenciach - to niektorym podobnym webom chyba - napr. asdf.sk sa javi ako neinteraktivna sluzba a tu robi celkom chybu - mala by klast vacsi doraz na to, ze nie je iba puhym vyberom clankov.

  10. [10] dusoft, 22. september 2006 00.08

    Suhlasim, to si uz ale vyzaduje ist nad ramec zberu RSS ci noviniek od uzivatelov. Napr. algoritmus, bayesiansky system a pod.

  11. [11] rony, 22. september 2006 20.13

    [10] áno, je tu stovka schopných ľudí, ktorí sa zakopávaniu programovaním dokola toho istého. Už sa teším, že ďalší mainstreamový produkt už nevznikne zosekaním anglofónnych vzorov.

  12. A tvoj názor?






Podmienky pre Váš komentár: Tlačidlo na odoslanie stlačte 1x, v texte nenadávajte, nevkladajte linky za účelom SEO, nepropagujte, Váš text musí mať zmysel, neporušujete vlastnícke práva majiteľa tejto stránky, ste pravidelný čitateľ tejto stránky, komentujete príspevok (nie erupcie Slnka) a nemýlite si komentáre s kvákacími fórami a chatom. Používajte formátovanie TEXTILE najmä na odkazy! Rozumiete tomuto poučeniu? áno, nie alebo Týmto sa pošle komentár?



funkcionalita - kto by bol spokojný s obyčajnou funkciou, ked môže mať rovno funkcionalitu? Je to dlhšie, znie to odbornejšie a dajú sa za to naúčtovať väčšie peniaze, keď posielame faktúru za nové webové stránky. Malý bullshitový slovník



Čítal som

Stručne komentované stránky, ktoré ma zaujali:

  • V Bombaji útočili teroristi. Rukojemníci sú v horiacom hoteli 07.59 Pri šiestich útokoch zomrelo najmenej 101 ľudí, z toho najmenej šesť cudzincov, zranených je 200-300 ľudí.
  • The Index.htm thread for Popcorn Hour 09.23 Velmi zaujimava rozsiahla tema diskusii okolo index.htm v PCH - spusta sa okamzite po nabootovani PCH ak je v roote.
  • Movable Type po rokoch | OttY@page 14.23 Z neistej príčiny som sa rozhodol, že si bližšie obzriem ako sa darí Movable Type („MT“), CMS napísanom v Perli, ktorý dnes nie je veľmi „IN“, aspoň v našich končinách (platí pre Perl aj pre Movable Type). Z dôvodu lepšieho ohmatania som si ho nainštaloval na hostingový server a trochu som sa pohral.
  • Dita Von Teese - Playboy, december 2008 12.58 Ditka v sete rozne ladenych fotografii.
  • 2.2 Firmware Now Available in iTunes 12.58 The newest version of firmware is now available in iTunes, version 2.2. We’re installing now on a test phone and will be providing screen shots and a direct link as soon as possible.
  • Kázeň musí být V. 12.58 Evžen vypadal zdrceně. Už zase v dobrém úmyslu, sám v roli poškozeného, porušil zákon. Protože věděl, že zákony se mají respektovat a navíc z toho neviděl cestu ven, zvláště poté, co se sám přiznal do protokolu, opět mužně přijal udělený trest. Je teď bez rádia, bez okénka, bez stěračů, bez poklic a bez antény, navíc ještě bez řidičáku a o pět tisíc lehčí.
  • Je čas na redefinici přístupnosti 11.15 Jestliže si nemohu jedním kliknutím přenést vlakový spoj z IDOSu do svého googlího kalendáře, není pro mne IDOS dostatečně přístupný.
  • Web - metody nahrazování standardních fontů - Chaos sanctuary 20.21 Standardní fonty se nahrazují především v hlavičkách a krátkých textech. Žádná z dále uvedených metod – sIFR, facelift (flir), typeface.js a font-face/CSS - není vhodná pro delší text. Všechny tyto metody jsou relativně nové a stále se vyvíjejí.
  • Nechte je padnout - Bloc 15.49 Ekonomická krize stejně jako každá správná choroba míří do další fáze. Zprávy z trhů už nejsou katastrofické, pouze špatné, pokles burz už není střemhlavý, ale pouze mírný a setrvalý, firmy nehlásí nečekané krachy ze dne na den (viz Lehman Brothers), pouze propouštějí po desetitisících a pouze hlásí snížení výroby či odbytu o pět, deset, dvacet procent.
  • Po ISS se prochází pavouk, dalšího zřejmě zmátl stav beztíže 14.39 Pavouka číslo dvě totiž natolik zmátl stav beztíže, že svou přepravku zaplnil sítěmi, aby přestal volně poletovat. V propletených síťových shlucích se nedá poznat, jestli je tam jeden nebo dva pavouci.
  • Got my girlfriend to model for my car (PICS) 09.39 Chlapik nafotil svoju priatelku pri svojom aute. Reakcii je tam na vyse 60 stran. Stravite na tejto stranke naozaj dlhy cas :-)
  • Tomanová má plán - eTREND 08.00 Ministerka Tomanová v relácii Slovenského rozhlasu "Sobotné dialógy" predstavila svoj plán zmien v systéme sociálneho poistenia a dôchodkového sporenia.


kde to ste?

príspevky

média


Čítaš Spravodaj? Klikni na Surf.sk!

WebHosting: WebServer.sk

Na také to domáce ukladanie veľkých súborov Kotuha.com

Dva šifrované gigabajty zadarmo pre vaše súkromné zálohy na mozy

Späť na obsah