Blokowanie indeksowania przez wyszukiwarki za pomocą tagu noindex
noindex
to reguła ustawiona za pomocą tagu <meta>
lub nagłówka odpowiedzi HTTP, która służy do zapobiegania indeksowaniu treści przez wyszukiwarki, które obsługują regułę noindex
(np. Google). Kiedy podczas indeksowania Googlebot wyodrębni ten tag lub nagłówek, całkowicie wyeliminuje stronę z wyników wyszukiwania Google niezależnie od tego, czy w innych witrynach znajdują się prowadzące do niej linki.
Dyrektywa noindex
pozwala kontrolować dostęp do poszczególnych stron witryny i przydaje się, gdy nie masz dostępu do katalogu głównego serwera.
Stosowanie dyrektywy noindex
Są 2 sposoby stosowania dyrektywy noindex
: w postaci tagu <meta>
oraz jako nagłówka odpowiedzi HTTP. Dają one taki sam efekt, więc wybierz metodę, którą łatwiej zastosować w Twojej witrynie i która lepiej pasuje do Twojego typu treści. Określenie reguły noindex
w pliku robots.txt nie jest obsługiwane przez Google.
Możesz też połączyć regułę noindex
z innymi regułami kontrolującymi indeksowanie. Możesz na przykład połączyć podpowiedź nofollow
z regułą noindex
: <meta name="robots" content="noindex, nofollow" />
.
Tag <meta>
Aby zapobiec indeksowaniu pewnej strony z Twojej witryny przez wszystkie wyszukiwarki, które obsługują regułę noindex
, umieść w sekcji <head>
danej strony ten tag <meta>
:
<meta name="robots" content="noindex">
Aby zapobiec indeksowaniu strony tylko przez roboty Google:
<meta name="googlebot" content="noindex">
Pamiętaj, że niektóre wyszukiwarki mogą interpretować regułę noindex
inaczej. W efekcie w innych wyszukiwarkach strona może wciąż pojawiać się w wynikach wyszukiwania.
Więcej informacji o tagu noindex
<meta>
Nagłówek odpowiedzi HTTP
Zamiast tagu <meta>
możesz w odpowiedzi zwrócić nagłówek HTTP X-Robots-Tag
z wartością noindex
lub none
.
Nagłówka odpowiedzi możesz użyć w przypadku zasobów w formacie innym niż HTML, takich jak pliki PDF, pliki wideo lub pliki graficzne. Przykładowa odpowiedź HTTP z nagłówkiem X-Robots-Tag
informującym wyszukiwarki, że mają nie indeksować strony, wygląda tak:
HTTP/1.1 200 OK (...) X-Robots-Tag: noindex (...)
Więcej informacji o nagłówku odpowiedzi z dyrektywą noindex
Debugowanie problemów noindex
Aby zobaczyć tagi <meta>
i nagłówki HTTP, musimy najpierw zindeksować Twoją stronę. Jeśli strona nadal pojawia się w wynikach wyszukiwania, dzieje się tak prawdopodobnie dlatego, że nie zindeksowaliśmy jej od czasu dodania reguły noindex
. W zależności od znaczenia strony w internecie może minąć kilka miesięcy, zanim Googlebot ponownie ją odwiedzi. Możesz poprosić Google o ponowne zindeksowanie strony za pomocą narzędzia do sprawdzania adresów URL.
Jeśli musisz szybko usunąć stronę witryny z wyników wyszukiwania Google, przeczytaj dokumentację dotyczącą usuwania treści.
Powodem może też być to, że plik robots.txt blokuje robotom indeksującym Google dostęp do danego adresu URL, co uniemożliwia im znalezienie tagu. Aby odblokować Google dostęp do strony, musisz wprowadzić zmiany w pliku robots.txt.
Na koniec upewnij się, że reguła noindex
jest widoczna dla Googlebota. Aby sprawdzić, czy implementacja noindex
jest prawidłowa, użyj narzędzia do sprawdzania adresów URL. Pozwoli to zobaczyć kod HTML, który Googlebot zeskanował w trakcie indeksowania strony.
Możesz też skorzystać z raportu Indeksowanie stron w Search Console, aby monitorować strony w witrynie, z których Googlebot wyodrębnił regułę noindex
.