Čo na internete je ale vyhľadávače nevidia

You may also like...

10 komentárov

  1. dusoft píše:

    Cielom autorov onych skrytych databazovych systemov by malo byt ich spristupnenie indexovaniu vyhladavacmi. Vacsinou je to velmi jednoducho riesitelne cez generovanu mapu stranok, v tomto pripade mapu odkazov na databazove polozky (to plati aj pre OR SR a podobne).

  2. burdo píše:

    data schovane za formularmi su sice „neviditelne“ pre vyhladavace, ale samozrejme existuju web data extraction frameworky, ktore simuluju aktivity uzivatelov na ziskanie dat z hidden/deep webu

  3. rony píše:

    [1] nemusia ten ciel vobec poznat, naviac by museli viac programovat, ci dokonca to ani nevedia spravit, lebo pouzili nejaky instantny system, kde to je doslova nemozne dorobit. a mozno je to aj prirodzena selekcia – ak to nevies spravit, zrejme by si aj tak iba preplnil vyhladavac nezmyslami (renundantnymi datami)
    [2] ano, to som nenaznacil ale aj o tom je samozrejme vediet. otazka je, ci su taketo vyhladavace vobec prakticky pouzivane resp. obsiahlejsie vyuzivane.
    Kto vie, ze ma „skryte“ data mozno vytvori k svojim datam nejake API a kto chce, moze si nezavisle na nom urobit vytahovanie dat. Ak su to data, ktore chcem poskytovat ale nechcem to robit sam, tak necham cestu inym.
    Neviem sa rozhodnut, ci je dobre alebo zle, ze znacna cast dat na internetovych vyhladavacoch nie je.
    Co ale prizvukujem je fakt, ze internet zacal v realnom case odrazat nasu historiu iba do svojho vzniku a to je kratky cas…

  4. burdo píše:

    [3] ak prakticky znamena komercne, tak ano. ak masovo, tak nie ;-)

  5. dusoft píše:

    web data extraction frameworky – to je sporne – pri napr. nejakych operaciach musis vkladat do tych systemov nezmyselne udaje, aby si sa dostal dalej. cize zaplavujes system niekoho nezmyslami. to nie je cesta.

  6. burdo píše:

    [5] prosim nejaky priklad, nech jeden nerozprava o A a druhy o B

  7. dusoft píše:

    no, predpokladame, ze to chces pouzit na extrakciu dat zo stranok, ktore su pristupne len cez formular. v tomto pripade, ale vystavuje formularovy system riziku zadania nejakych udajov do formulara – casto musis zadat aj nieco manualne, aby si sa dostal dalej.
    predstav si, ze chces pustit extraction framework na nejaky system, ktory ma rezervacie alebo podobny typ akcie – v tomto pripade pustat robota na nieco, co chce od teba udaje – predpokladam, ze web framework spravi len to, ze tie udaje si vymysli – vymysli si meno, atd. a vykona nejaku akciu, ktora ma nasledky rozne.
    ak je ale cielom ziskat pristup ku stranke, ktora je az za formularom, inak sa k nej nedokazes dostat…. cize tam je to riziko odosielanie blbosti cez fomular.
    ak je cielom cisto prejst nejaky formular typu ORSR, tam problem nevidim.

  8. Gabriel píše:

    To, co popisujes v clanku je iba jedna z prekazok, ktore je potrebne riesit pri aplikacii SEO. Je to rovnaka prekazka ako napr. flash ci javascriptove menu a pod. Proste veci, cez ktore crawler vyhladavaca nepreleze pri indexovani na dalsiu stranku.

  9. rony píše:

    [8] to samozrejme k skrytemu webu patri. samozrejme prípad „skrytia“ databázy za formulár odtieni spoľahlivo kopec informácii. Chcel som uviesť príklad slovenskej pošty práve preto, že na ne sa až tak veľmi nemyslí.

  10. 2ge píše:

    myslim si ze, je skoda nespomenut GET a POST pri formularoch. Ak je formular rieseny cez GET, tak ho google a ine vyhladavace urcite skorej zaindexuju ako cez POST. Myslim si – dalsia vec – google sa dostava k takymto URL cez toolbar, cize user co ma google toolbar, zada napriklad do ORSR ICO, a google sa dozvie o takomto odkaze, ktory neskor zaindexuje (aspon by mal…)