Jak usunąć lub zablokować stronę w Google Cache?

Data dodania wpisu: 13-09-2010

Powszechnie wiadomym jest, że Google "żre" wszystko, co mu w łapska wpadnie. Indeks stale powiększa się o tysiące podstron. Czasem jednak zajdzie potrzeba, gdy określone (pod)strony naszego serwisu nie mogą być indeksowane przez Google np. ze względu na wrażliwe dane, np. imię, nazwisko, adres osoby ogłaszającej swoje usługi na portalu ogłoszeniowym. Inną przyczyną są strony np. o krótkim okresie żywotności - to również często tyczy się ogłoszeń, które jak szybko pojawiają się w sieci, tak szybko znikają - i robi się bajzel szybko kierujący ruch do stron z magicznymi cyframi 404 :P

Jak blokować archiwizowanie podstron w Google?

Tutaj technicznie mogę opisać jedną wystarczającą metodę: zastosowanie odpowiedniego nagłówka META.

Wystarczy, że w sekcji <head> dodamy kod:

<meta name="Robots" content="noarchive" />

Typ "noarchive" informuje roboty wyszukiwarek, aby strona z takim tagiem META nie była archiwizowana - dodawana do cache wyszukiwarek.

Jeżeli chcemy zaś uniemożliwić cache'owanie podstron serwisu tylko dla Google, za to dla innych wyszukiwarek podstrona ma być normalnie widoczna w pamięci podręcznej, stosujemy:

<meta name="Googlebot" content="noarchive" />

Jak usunąć istniejący cache w Google?

Technicznie - używając tego samego tagu, co w przypadku pierwszej opcji - lecz tutaj z kolei musimy łaskawie czekać, aż robaczek Google odwiedzi naszą podstronę nadającą się do wyrejestrowania z Google Cache.

Jak usunąć podstronę z indeksu Google?

Tutaj sprawa jest nieco bardziej złożona - metod na blokowanie dostępu jest kilka i technicznie, te same metody mogą posłużyć do wyindeksowania strony z indeksu wyszukiwarek. Niestety, w przypadku wyindeksowania, jesteśmy ponownie skazani na oczekiwanie.

Sprawę blokowania dostępu do podstron dla robotów wyszukiwarek internetowych można przedstawić na dwóch najpopularniejszych sposobach - tagu META oraz regule w pliku robots.

W przypadku tagu META, wystarczy w sekcji HEAD wrzucić:

<meta name="Robots" content="noindex" />

Reguła informuje robota wyszukiwarki, aby nie indeksował wybranej strony.

W przypadku plików robots, wystarczy z kolei, że do reguł dopiszemy:

User-agent: *
Disallow: /adres-mojej-podstrony.html

aby robot nie indeksował wybranego adresu, lub:

User-agent: *
Dissalow: /kategoria/moje-ulubione/*

aby robot nie indeksował żadnej podstrony, której adres zaczyna się od "/kategoria/moje-ulubione/".

Do metod usuwania podstron z indeksu Google można również zaliczyć dwie dodatkowe metody: nieco bardziej zaawansowana, bo wymaga pewnych zmian programistycznych - wysłanie nagłówka o kodzie 410, który dla Google jest niczym innym, jak natychmiastowym poleceniem w stylu "Wyrzuć tą stronę z indeksu", czyli:

<?php
header("HTTP/1.0 410 Gone");
?>

Druga metoda, to wykorzystanie narzędzia do usuwania podstron z indeksu Google poprzez panel Webmaster Tools. Jest to niestety robota czasochłonna, jeśli adresów do usunięcia jest sporo. Panel usuwania adresów z indeksu Google jest dostępny pod adresem: https://www.google.com/webmasters/tools/removals

 

Komentarze

One big thing that discourages asriipng internet marketers from pushing through is the development of a website. A lot of people are not internet and website savvies, even though they have a lot of marketing skills many people are having a hard time setting up their websites. Thanks for sharing your info on Site2You, many people will benefit from this post. Creating an online business is not that hard once you get the hang of it, but when you do it the first time, it is really not easy. Cheers.
Gumis, bug z tagami w komentarzach poprawiony;) Wyedytowałem Twoje posty :)
<meta name="robots" content="all, noimageindex" />
<meta name="revisit-after" content="14 days" />
<meta name="googlebot" content="noarchive">

Tym wpisem mówisz robotom: indeksujcie moją stronę i linki, ale nie grafiki. Odwiedzajcie mnie co 14 dni. A ty google, nie rób kopii mojej strony.
Bardzo fajne! :)
dobrze napisane a teraz mam nadzieje ze zacznie dzialac poprawnie moja strona :)
Comments closed...