Vylúčenie častí kódu a obsahu webstránky z indexu Google

Pokiaľ máte v kóde dokumentu obsah, ktorý nie je to najhlavnejšie, čo chcete, aby Google pri indexovaní zohľadňoval, zobrazoval či uprednostnil pred dôležitejším, tak môžete byť celkom neštastní. Ako z toho von?

Priznám sa, že aj ja s tým bojujem. Keď na Spravodaji zapnem “Featured” – slider s ukážkami dôležitých príspevkov – tak všetky možné služby ako Facebook, Google si ako na potvoru vyberú obrázok a obsah z Featured. Irituje ma to, lebo už len pridávanie linku na článok na Facebook to komplikuje, nepatričný obsah vymazať, vybrať iný obrázok. Nehovoriac o tom, že taký Google Plus je nemehlo a neumožní mi ani len toto.

Pre Google, a koho iného, som našiel na jeho podpore tento text. Pomôže, pokiaľ používate Custom search.

Časti obsahu alebo kódu sa uzatvoria boxami s triedou nocontent.

To je pomerne nenáročný zásah, vieme, že nemusíme vkladať žiadny nový div, len pridáme k príslušným už existujúcim túto triedu. Kľudne aj takto

<div class="sidebar nocontent">
...
</div>

V nastavení Custom search však musíte toto opatrenie Googlu láskavo oznámiť.

V ľavom stĺpci kliknite na Advanced. V sekcií Download context section kliknite na Download XML format. Stiahnutý súbor otvorte (Poznámkový blok a pod.) cse.xml a pridajte nový atribút enable_nocontent_tag=”true” v zna4ke CustomSearchEngine. Napr.

<CustomSearchEngine id="id" creator="id">

zmeňte na

<CustomSearchEngine id="id" creator="id" enable_nocontent_tag="true">

Potom súbor vložte naspäť v sekcií Upload context section.

Teraz by to už chcelo naučiť to aj hlavný vyhľadávač Google.

Ďalšie riešenie je bohužiaľ zložitejšie a v podstate nečisté. Ak vládnete svojim šablónam kódu dokumentu, musíte doprogramovať identifikáciu “návštevníka” a pokiaľ je ním Google, neposielať mu všetko. Je to zlé riešenie, fakt zlé. Nie, že by sme ho technicky nezvládli. Naopak, je to rýchle. No dôsledky na správanie sa vládcu sily Googlu môžu byť pre indexovaný web fatálne.

Napísal rony