Keby som teraz vylepšoval vybrali.sme.sk

Tak by som sa zameral na SEO spammerov programovo a na tapetarov výchovne. Čo by som urobil?
Jednoduché veci:
* vo vkladacom formulári jasné upozornenie, že príspevky nepreberajú „silu“ vo vyhľadávačoch (za predpokladu nofollow a príslušných záznamov v robots.txt – ak by to nestačilo, tak žiadne priame linky),
* na tom istom mieste PRÍKLAD ako by mal príspevok vyzerať (napr. povestné titulky s názvom .týždeň),
* a rovnako na tom mieste odkaz na pravidlá a extrémne stručný výťah z nich aj priamo.
Zložité veci:
* získavať Google Pagerank vkladaných stránok a ZOHĽADŇOVAŤ ho – ako presne, to neviem,
* účty SEO spammerov sú známe, sú tam minimálne dvaja, ktorí sú bezohľadní notorici – kvôli nim zaviesť a aktívne dopĺňať bany na domény – dočasné aj trvalé,
* bany na účty používateľov – ak je tapetár, tak po vložení príspevku ďalší môže vložiť po oznámenom čase (v dňoch!!!),
* sledovať kombináciu IP, účtu, cieľových adries,
* ak niekto vytrvale vkladá len príspevky k obmedzenému počtu URL (domén), tak to nerobí z lásky k používateľom vybrali.sme.sk a takýto človek je pre nich škodnou,
logoZačína prevažovať „jednotková“ prvá strana noviniek. To je dôsledok prirodzeného zvyšovania popularity stránky a jediné schodné riešenie je uplatňovanie týchto kritérii a možno ešte ďalšie:
* vybrali.sme.sk má možnosť vytvorenia okruhu priateľov, tak chcem mať aj svoj osobný banlist,
* filter na príspevky s viac ako 1 hlasom – najmä v novinkách,
* komunikačný systém – ak sa niekomu zmaže príspevok, musí mu to web dať na vedomie, čo porušil – prihlási sa nabudúce a musí sa mu to zobraziť,
* obávam sa, že na submitnutie už veselo existujú skripty – musí sa tomu zabrániť – cesty existujú. Web vyžaduje javascript, takže kľudne dynamicky generovaný form cez javascript s náhodnými parametrami.
* doporučovať webom ako je .týždeň (to je príklad! nenašiel som iný vhodný príklad), aby na svojom webe naprogramovali, že platený obsah nebude obsahovať tlačítko na vybrali.sme.sk a vydá sa dokument s doporučeniami ako automaticky vkladať titulok aby mal zmysel,
* po založení účtu nedovoliť vkladať príspevky – toto pravidlo je najkrajšie zo všetkých – naučí človeka najprv web používať, zoznámiť sa s ním a úplne zruší účty zakladané jednorazovo či s účelom rýchlo vytapetovať a zaspamovať.
Predpokladám, že príde čas na takéto otázky.

Môže sa Vám ešte páčiť...

17 komentárov

  1. depi píše:

    V podstate suhlasim a dodavam, ze by si tieto pravidla mohol vziat k srdcu akykolvek podobny (linkovaci) web.

  2. alian píše:

    Samozrejme plne suhlasim! Vybrali.sme.sk ma svoju hodnotu a uroven, to co si popisal je potrebne a uzitocne a myslim ze by to sluzbu posunulo o nieco vyssie

  3. Smad píše:

    S odstavenim vvyhladavacov pomocou norobots a podobnych veci plne suhlasim. Aj ked si mylim ze ludia co tam davaju svoje vlastne prispevky nie su ani tak o SEO ako skor serblikari, ktori sa chcu pochvalit tym, co prave vytvorili (ako ked male decko dobehne za maminou s plnym serblikom). Banovat ich a podobne, to ano. Som ale zvedavy, ako sa sme.sk zachova k svojim blogerom. Je to v konecnom dosledku ich web.
    Urobit nejaky ten UR (user rank) by tiez nebolo zle, aj ked neviem ako. Mozno privatny pomocou friends ako spomynas.
    Demokraticke hlasovanie (1 ludo/klik = 1 hlas) je tiez zastarale. Pocet bodov by bolo podla UR a hlavne taky neregistrovany hlas by mal tak 0,1b aby sa odburali mydlovi a podobni uctievaci.
    Filtrovanie a triedenie by tam bolo dobre dat nejake univerzalne – podla vsetkeho dostupneho.

  4. Ruziklan píše:

    Rony: Viacere navrhy sa mi pozdavaju a zaradim si ich do svojho arzenalu navrhov, ktory uz mam davno spisany – a ten je aj bez toho dlhy.
    Smad: Navonok sa vsetky hlasy zdaju rovnake, ale ubezpecujem Ta, ze davno nemaju rovnaku vahu (a mozno ani nikdy nemali, len som pri vybrali.sme.sk nebol od zaciatku).

  5. rony píše:

    [3] je tam jeden registrator, ktory vklada odkazy na weby ceskych firiem. Evidentne ide o sucast nejakych SEO sluzieb. Jasne, ze jeho prispevky rychlo miznu.
    Serblikarov ani velmi nevnimam, skor s usmevom, ako posledne dni ten co zacal pomerne hrozivo – tj. mirrorom celeho webu nejakej nabozenskej skoly ci co to bolo :-)
    Userank tam je :-) len tam nie je uplatneny u stranky noviniek.
    Mimochodom: trochu sa hanbim, ze posledne dni tam mam az dva clanky zo Spravodaja, verim, ze to pre niekoho znamena vyzvu ma poriadne zotriet :-)))))

  6. otty píše:

    [5] presne, Ty budeš tá čarodejnica, na ktorú bude hon.
    Inak zaujímavé a sympatické návrhy. Vidieť, že „vybrali“ používaš, čo už ja nejaké obdobie akosi nerobím.

  7. Tomáš B. píše:

    Vďaka, niektoré veci budeme určite realizovať.

  8. Viliam Búr píše:

    Osobný banlist tam chýba ako soľ — je to dôvod, prečo som túto stránku prestal používať. Zoznam nových článkov je plusmínus hromada spamu, a osobný banlist by to pomohol prečistiť. (Alebo keby niekto takýto banlist implementoval ako skript pre Greasemonkey.)

  9. Anton Piták píše:

    Rony, pekne napísané, ale nereálne. Napr. na základe čoho a kto bude určovať, čo je ten „správny“ príspevok a čo nie? Sme túto službu poskytuje verejne, ťažko by odôvodňovala čo a prečo cenzúrovala. Pre 30 ročného človeka sú prínosné iné články ako pre 18 ročného a obaja sú pritom cieľovou skupinou Sme. ďalej, vieš si rpedstaviť v dnešnej „demokratickej“ spoločnosti, že budeš u takto verejne poskytovanej služby niečo filtrovať bez „súdneho rozhodnutia“? Bolo by to skôr kontraproduktívne. Následná vlna kritiky by bola asi viac škodliva ako samotné filtrovanie. filtrovať treba, ale s polovicou veci čo píšeš to nemá opodstatnenie. Je to len pohľad „čo sa páči tebe“. Lenže tu nejde len o Teba.
    Napriek tomu súhlasím, že niektoré veci sa vylepšiť dajú … určite by sa mohlo riešiť tapetovanie, aby z jedného webu neodkazovalo naraz 100 článkov, to by malo byť aj v silách programátorov poriešiť to. Blbosť je trošku ten Pagerank a chápem, prečo píšeš, že „nevieš ako“. Ako? Sú novovznikajúce weby a budú stále, je predpoklad že s doháňaním sveta budú stále lepšie a lepšie. Kým získajú nejaký pagerank, prebehne veľa vody. Tak by v podstate boli na predných miestách len staré a zabehané weby, či weby ako .týždeň, etrend a pod. Tak to potom už ani nemá význam nič iné riešiť z tvojích návrhov, lebo pagerank by to veľmi kvalitne „vyriešil“. Na titulku by sa dostali už len pár známych webov. Pravdepodobne ani tento tvoj blogspot by sa tam už nedostal :)
    Takže s niektorými vecami sa dá súhlasiť, s tými, ktoré zvyšujú užívateľský komfort, ale s tým filtrovaním, či skôr cenzúrovaním, to je tak súkromný výkrik do tmy :)

  10. rony píše:

    [9] ale ved uz teraz sa prispevky MODERUJU.
    Tie si malokedy zachytil, ze tam vobec existovali, prihlas si napr. RSS kanal noviniek vybrali.sme.sk a zistis, kolko ich byva.
    Obvykle su to prispevky pridavane s jedinym cielom – robit PRIAMY prospech cielovej stranke (obvykle financny) bez akejkolvek protihodnoty.
    S patricnym rozhladom na internete lahko identifikujes, ze propagacia cojaviem „na tomto webe stiahnes mp3ky zadarmo“ alebo „preseovane“ odkazy na stranky firiem, su prave z tejto kategorie.
    Rovnako zblbnuti prispievatelia, ktori denne nasypu 5-6 odkazov na vlastne stranky atd.
    Pre kristove rany, s clovekom, ktory sa u sluzby poskytovanej sukromnym subjektom ohana „demokraciou“ a „verejnym poskytovanim“ sa asi nedohodneme, pretoze moje nazory na sukromny majetok su s nim nekompatibilne. Vybrali.sme.sk je sukromny majetok a s nim si moze kazdy nakladat ako chce, tj. aj keby si majitel tym poskodzoval. Cize rozhodnutie o pravidlach JE len na nom, nie na „nazore verejnosti“.
    Na tuto temu sa nechcem dalej bavit, je to tema, ktora zbytocne vyhrocuje diskusiu a je milionkrat premielana.
    Neviem ako si zbehly v praktikach spamerov a tapetarov na internete ale s demokraciou by si u nich nijako nepochodil. Pohlad majitela je uplne iny ako pohlad anonymnej verejnosti.
    Preco by sa nemal zohladnovat Pagerank od Google? Nevidim najmensi dovod.
    Ak Google vyhovuje, ze nove stranky maju PR 0 a VSETCI v klude zijeme a pouzivame vyhladavace, tak preco by ista miera hodnovernosti domeny nemohla byt zohladnena? Nevidim ziadne „proti“. Vobec to nezablokuje „uspech“ novych domen, staci navolit primeranu vahu pre tento faktor, preto som napisal „neviem ako“.
    Obvykle plati: ak zoberieme sumu clankov zo zavedenych webov a tu istu sumu z „novych“ blozinkov a roznych novych MFA domen, tak citatelia vo vyssej miere ocenia (myslim si) tie prve. Preto to koreluje so zaujmom citatela. Ide len a len o mieru s akou sa na tento faktor bude prihliadat.
    Beries to ciernobielo a taky svet nie je :)
    Beries to, akoby som napisal „vsetko s PR mensim ako 5 sa nebude zobrazovat vobec a rovno sa bude vymazavat“ a to som nenapisal, skoda, ze si to tak pochopil.
    Ide len o to, ako vizualne vyznacit rozne faktory zvysujuce a znizujuce doveryhodnost prispevku a prispievajuceho. A hlavne viacmenej automaticky vypoctom z konkretnych cisiel.
    K tvojej poznamke, ze by sa ani moj blogspot tam uz nedostal len nie prilis dolezita moja poznamka: over si moje PR, domena tu zije tusim 6 alebo viac rokov, jej obsah je na trvalych linkoch, takze vyhladavace nedetekuju radikalne zmeny a kopec inych faktorov, o ktorych si myslim, ze z mojej domeny robia lukrativne miesto. Ale to nie je dolezite :-)
    _Poznamka k svetonazoru:_ Slova ako _“cenzura“_ u mna NIKDY nespominaj v spojeni s prevadzkou sukromnych webovych projektov ci cinnosti sukromnych subjektov nad vlastnym majetkom, pokial sa netykaju STATNEJ CENZURY. Cinnost oznacovana ako *cenzura je* pre mna jedine *statny zasah* do slobody slova. Akonahle to chapes ty inak, potom sme proste ludia s inym politickym zmyslanim a VELMI tazko sa pochopime, pokial TY alebo JA nebudeme chciet vnimat pohlad protistrany.
    Akesi predpisovanie „anonymnej verejnosti“ ako ma kto nakladat s vlastnym majetkom a ak to nahodou chce robit, oznacovat to za cenzuru je pre mna prejav svetonazoru, ktory NEZDIELAM a povazujem za skodlivy. Tym nechcem povedat, ze je tu skupina ludi, ktora VLASTNI takyto svetonazor a nedajboh sa ich snazim za to nejako postihnut, ci vylucit zo spolocnosti. Proste ho nezdielam.

  11. rony píše:

    Cenzura by teda bola – PRE MNA – v tom, keby STAT prikazal SME.sk, aby z vybrali.sme.sk odstranila nejaky prispevok.
    Vo vsetkych ostatnych pripadoch je odstranenie prispevku PLNYM PRAVOM SME.sk a to dokonca v pripade, ze by VSETCI okrem SME.sk BOLI PROTI. Ti vsetci mozu mat na to akurat nazor ale rozhodne musia respektovat VOLU majitela.
    Je irelevantne, ci ide o verejne prevadzkovanu sluzbu.
    Ja osobne by som nesuhlasil, aby by nejaky Janko z Belej trval na tom, ze Spravodaj je verejne prevadzkovana sluzba a „predpisoval“ mi, co mozem a co nemozem so Spravodajom robit.
    Obmedzoval by moju slobodu narabat s mojim majetkom.
    Tieto moje reci su uz 100x omlete, skoda, ze ich vobec musim pisat.
    Asi zverejnim „keby nieco“ tak, ako „pred par dnami Arthur Dent.“:http://www.misantrop.info/aby-bylo-jasno

  12. rony píše:

    *Este k mojim navrhom* – je len a len na vlastnikovi, co aplikuje a ako, ba dokonca ci neaplikuje uplne opacne pravidla ako ja povazujem za prospesne. Ja dokonca kvoli neuplatneniu navrhov NEBUDEM vlastnika napadat ani ho nenavidiet. Je len a len na mojich schopnostiach VEDIET navrhnut to, co sa skutocne aplikuje v sulade so zaujmami vlastnika.
    To len aby si tu niekto nemyslel, ze moje navrhy su „hotova“ vec.

  13. Anton Piták píše:

    Rony, prečo ten rozčúlený tón. Nikde nepíšem, že si to sme nemôže regulovať, napísal som aj slovo demokratickej do úvodzoviek, aby som ten význam zľahčil, nie je treba sa oň až tak opierať, ako to robíš. A nechcem na niektoré tvoje vety reagovať, také kategorické vyjadrenia mi pripomínajú iných na slovensku, ktorí tiež niečo ľutujú a za každou reakciou vidia nepriateľov. Ja som nepísal ako nepriateľ voči tebe ale ako diskutujúci.
    Nikde nepísal, že nesúhlasím s fitrovaním MFA či webov, kde je za deň 10 príspevkov z jedného nevýznamného webu, ale že je ťažké určiť tú správnu hranicu. A že zle určená hranica by mohla byť kontraproduktívna aj pre samotné sme.sk. Čo sa týka cenzúry, hľadím, aké názory presadzuješ a hľadím s otvorenými očami. Ak NEMÁM taký či onaký názor, tak NEMÁM to či hento, ak robím toto takto a nie takto, ako rony, tak nemám to či ono, to mi pripomína zašlé časy. Tuším si v podobných rokoch ako ja, tak sa naozaj čudujem týmto postojom. A ešte obviňovať ma z čiernobielého pohľadu a neviem čoho, snáď som asi „len sprostý natvrdlý redaktor“, ako je teraz zvykom vyjadrovať sa na Slovensku.
    Nejdme riešiť, čo si tu popísal o cenzúrach, o svojích pohľadoch (uznávam, sú to tvoje pohľady a mám právo si myslieť, rovnako ako si to právo vyhradzuješ Ty, že to možno nie sú tie najsprávnejšie názory), toto bola diskusia o návrhoch a ich možných dopadoch a nie o svetonázoroch. Nechápem, čo sa Ťa tak dotklo, ale máš na to právo. A samozrejme, nemusíš ani túto moju reakciu uverejňovať, je to Tvoj blog.

  14. rony píše:

    [13] zle si to pochopil, nie som rozculeny, nechapem ta ako nepriatela, o ziadnej hranici nehovorim, pisem o moznostiach aplikacie VAHY dolezitosti, ktora prispeje k poradiu, ci vizualneho oznacenia prispevkov.
    VZDY, ked niekto v suvislosti so sukromnym sektorom pouzije slovo „cenzura“, tak inu reakciu odomna nemoze ocakavat – pre mna je cenzura VZDY utok na slobodu slova a fakt, ze nejaky sukromny subjekt nejaky nazor, prispevok alebo cokolvek VYMAZE nie je cenzurou ani nicim, co rusi slobodu slova postihnuteho. Cize cenzurou nie je. *Pre mna je cenzura uplne obmedzenie slobody slova* a to tak, ze vybrany objekt ho nemoze nijakym sposobom zverejnit. V sukromnom sektore plati – jeden ma nechce, druhy ma toleruje, treti ma privita. Ak ma jeden z tych troch nechce, tak nie je cenzor. Tento nazor bude odomna pocut KAZDY, kto toto slovo pouzije.
    Najdi si miesto cenzura INE oznacenie cinnosti akou oznacujes redakcnu cinnost resp. moderovanie.
    Nic sa ma nedotklo, samozrejme. Nepresiel si do roviny osobnych invektiv a sice by to malo byt normalne :-) ale ocenujem to :-)
    Trvam iba na tom, ze jablko sa ma nazyvat jablko, slovo slovom, weblog weblogom ako aj cenzura ma jasny vyznam a nemoze sa nou oznacovat vykonavanie vlastnickych prav nad sukromnym majetkom a to ani v pripade, ze ide o publikacny system, kam pchaju texty cudzi ludia. Je to STRASNE jednoduche na pochopenie rozdielu :-) Cenzura je stav, kedy postihnuty nesmie NIC NIKDE publikovat.

  15. Anton Piták píše:

    Tak som rád, že sme si to vysvetlili v už jemnejšej nóte, aj keď pohľad na slovo cenzúra môžeme mať rozdielný. Ale to je môj pohľad na vec a beriem, že tvoj je iný. Vlastnícke práva si tiež ctím, ale asi som vychovaný inak a vlastnícke právo mi nie je natoľko nadradené nad ďalšie práva, ktorú tu tiež môžu byť. Ale niečo si dovolím napísať v tvojom štýle a nepoužijem zbytočne žiadne veľké písmo … Prečo si myslíš, že by ono „súkromné“ SME malo riešiť veci tak, ako ich chceš ty a nie ako ich chcem ja či niekto iný? :))) Ako vidíš, je tu naozaj milion rôzných možností, ako sa dá na vec hľadieť a o čiernobielosti tu nemôže byť ani reč ;)

  16. rony píše:

    [15] ja si myslim, ze SME si ma riesit veci tak, ako ich chce.
    celkom urcite som nenapisal, ze „ako chcem ja“ – nikde :-)
    vlastnicke pravo – to znamena aj to, ze si tolerantny a uznavas aj ine prava nad ne vyssie – ty sam ich akceptujes. To je to pravo, ktore mas a nikto ti ho nesmie ovplyvnovat. Konci tam, kde zacina zasa vlastnicke pravo inych :-)
    To ani nie je vychova, to je proste slusnost – k cudzim veciam sa spravam ako k cudzim :-) nie ako k mojim :) (v zmysle – k cudzim veciam mam respekt a nedovolim si ich pouzivat ako keby boli moje vlastne).
    Keby mala nastat situacia, ze je BEZNE „prebijat“ vlastnicke pravo hocijakym rozmarom ci echt dolezitym vyssim pravom, tak vtedy spolocnost proste padne. To je potom proste 1984 :-)
    Musis mi dat priklad „vyssich“ prav – pokial vynechas zalezitosti ako pravo na zivot, zdravie a pod. humanne veci.

  17. rony píše:

    … a ktore zahrna ustava :-)