Usuwanie adresów URL, cz. 2. Usuwanie poufnych informacji ze strony

Piątek, 6 sierpnia 2010 r.

Jak pisaliśmy w naszym poprzednim poście na temat usuwania adresów URL, niekiedy może wystąpić jakaś zmiana – możesz całkowicie zablokować lub usunąć stronę ze swojej witryny. W innych przypadkach możesz tylko zmienić niektóre części strony lub usunąć określone fragmenty tekstu. W zależności od tego, jak często indeksowana jest strona, może minąć trochę czasu, zanim zmiany pojawią się w wynikach wyszukiwania. Z tego posta dowiesz się, co możesz zrobić, jeśli w wynikach wyszukiwania nadal wyświetlamy stare, usunięte treści czy to w formie krótkiego opisu, czy na stronie z pamięci podręcznej, do której prowadzi link z wyniku wyszukiwania. Ma to sens, gdy stara treść zawiera informacje poufne, które trzeba szybko usunąć. W przypadku zwykłej aktualizacji witryny nie jest to konieczne.

Przykładowy fikcyjny wynik wyszukiwania:

Wiluś E. Kojot < Stanowisko

Dyrektor ds. rozwoju w firmie Acme Corp 1948–2003: pracował nad
ściśle tajnym urządzeniem do łapania obiektów pędzących z nieobliczalną prędkością, które wykazało swój potencjał...

< Fragment
www.example.com/informacje/wiluśkojotW pamięci podręcznej < URL + link do strony w pamięci podręcznej

Aby zmienić zawartość wyświetlaną w krótkim opisie (lub na połączonej stronie z pamięci podręcznej), musisz najpierw zmienić zawartość rzeczywistej (opublikowanej) strony. O ile treści widoczne na stronie nie zmienią się, automatyczne procesy Google nadal będą wyświetlać w wynikach wyszukiwania fragmenty oryginalnych treści.

Po zmianie treści na stronie możesz skorzystać z kilku opcji, aby uwidocznić zmiany w wynikach wyszukiwania:

  1. Poczekaj, aż Googlebot ponownie pobierze i zindeksuje stronę: to naturalna metoda aktualizowania większości treści w Google. W zależności od tego, jak często Googlebot indeksuje daną stronę, czasami może to potrwać dość długo. Po ponownym pobraniu i zindeksowaniu strony jej stara zawartość zwykle nie jest widoczna, ponieważ zostaje zastąpiona bieżącą. Jeśli indeksowanie danej strony przez Googlebota nie jest zablokowane (przez plik robots.txt lub przez brak dostępu do serwera), nie musisz nic robić. Procesy skanowania i indeksowania są zautomatyzowane i zależą od wielu czynników zewnętrznych, więc zazwyczaj nie można ich przyspieszyć.

  2. Aby poprosić o usunięcie treści usuniętych ze strony internetowej innej osoby, skorzystaj z publicznego narzędzia Google do usuwania adresów URL. Za pomocą tego narzędzia musisz wpisać dokładny adres URL strony, która została zmodyfikowana, wybrać opcję „Treść została usunięta ze strony”, a następnie podać co najmniej jedno słowo, które zostało całkowicie usunięte z tej strony.

    narzędzie do usuwania pamięci podręcznej Google

    Pamiętaj, że na stronie nie mogą się pojawiać żadne z wpisanych przez Ciebie słów. Nawet jeśli słowo zostało usunięte z jednej części strony, prośba zostanie odrzucona, jeśli nadal będzie ono występować w innej części. Pamiętaj, aby wybrać takie słowo lub słowa, które nie występują już nigdzie na stronie. Jeśli w powyższym przykładzie usuniesz „top secret velocitus incalculii capturing device”, prześlij te słowa, a nie np. „mój projekt”. Jeśli jednak słowo „top” lub „device” nadal znajduje się na stronie, prośba zostanie odrzucona. Aby zmaksymalizować szanse na pomyślne usunięcie, często najlepiej jest podać jedno słowo, które na pewno nie pojawia się już w żadnym miejscu na stronie.

    Po przyjęciu prośby i potwierdzeniu, że podanych słów nie ma na stronie, wynik wyszukiwania nie będzie zawierał już fragmentu, a strona nie będzie dostępna w pamięci podręcznej. Tytuł i URL strony nadal będą widoczne, a wpis może się pojawiać w wynikach wyszukiwania haseł związanych z usuniętą treścią (np. wyszukiwania velocitus incalculii), nawet wówczas, gdy tych słów nie ma już we fragmencie. Jednak po ponownym pobraniu i zindeksowaniu strony w wynikach wyszukiwania będzie widoczny nowy fragment i strona z pamięci podręcznej.

    Pamiętaj, że usunięcie słów musi zostać zweryfikowane przez wyświetlenie strony. Jeśli strona już nie istnieje, a serwer zwraca prawidłowy kod wyniku HTTP 404 lub 410, przez to nie możemy jej wyświetlić. lepszym rozwiązaniem może być przesłanie prośby o całkowite usunięcie strony.

  3. Aby poprosić o usunięcie informacji ze strony z Twojej witryny, użyj narzędzia Google do usuwania adresów URL. Jeśli masz dostęp do danej witryny i jesteś jej właścicielem zweryfikowanym w Narzędziach Google dla webmasterów, możesz skorzystać z narzędzia do usuwania adresów URL (w sekcji Konfiguracja witryny > Dostęp dla robota), aby poprosić o usunięcie fragmentu kodu i strony z pamięci podręcznej do czasu ponownego zindeksowania. Aby użyć tego narzędzia, wystarczy przesłać dokładny adres URL strony (nie musisz podawać żadnych usuniętych słów). Po przetworzeniu Twojej prośby usuniemy z wyników wyszukiwania fragment kodu i stronę z pamięci podręcznej. Tytuł i adres URL strony nadal będą widoczne, a strona może też pojawiać się w wynikach wyszukiwania zapytań związanych z usuniętymi treściami. Po ponownym pobraniu i zindeksowaniu strony może być widoczny wynik wyszukiwania ze zaktualizowanym fragmentem i stroną z pamięci podręcznej (na podstawie nowej treści).

Google indeksuje elementy i określa ich pozycję na podstawie nie tylko zawartości strony, ale także innych czynników zewnętrznych, np. linków przychodzących. Z tego powodu adres URL może nadal pojawiać się w wynikach wyszukiwania dotyczących treści, które już nie istnieją na stronie, nawet po jej ponownym pobraniu i zindeksowaniu. Narzędzie do usuwania adresów URL może usunąć fragment i stronę z pamięci podręcznej z wyniku wyszukiwania, ale nie zmieni ani nie usunie tytułu wyniku wyszukiwania, nie zmieni wyświetlanego adresu URL ani nie zapobiegnie wyświetlaniu stron w przypadku wyszukiwań na podstawie bieżących lub wcześniejszych treści. Jeśli jest to dla Ciebie ważne, upewnij się, że adres URL spełnia wymagania dotyczące pełnego usunięcia treści z wyników wyszukiwania.

Usuwanie treści innych niż HTML

Jeśli zmienione treści nie znajdują się w pliku (X)HTML (na przykład zmienił się obraz w pliku Flash lub pliku PDF), nie możesz skorzystać z narzędzia do usuwania pamięci podręcznej. Jeśli więc ważne jest, aby stara treść nie była już widoczna w wynikach wyszukiwania, najszybszym rozwiązaniem jest zmiana adresu URL pliku, tak aby stary adres URL zwracał kod wyniku HTTP 404 i użycie narzędzia do usuwania adresów URL, aby usunąć stary adres URL. Jeśli zdecydujesz się umożliwić Google naturalne odświeżanie informacji, pamiętaj, że po ponownym zindeksowaniu podgląd treści w formacie innym niż HTML (np. linki szybkiego podglądu do plików PDF) aktualizuje się dłużej niż normalne strony HTML.

Proaktywne zapobieganie wyświetlaniu fragmentów stron i wersji stron z pamięci podręcznej

Jako webmaster możesz użyć tagów metaw pliku robots, aby uniemożliwić wyświetlanie fragmentów i wersji z pamięci podręcznej bez konieczności używania naszych narzędzi do usuwania. Nie zalecamy tego jako domyślnego rozwiązania (fragment może pomóc użytkownikom szybciej rozpoznać odpowiedni wynik wyszukiwania, a strona z pamięci podręcznej – umożliwić im przeglądanie treści nawet w przypadku nieoczekiwanego zdarzenia powodującego niedostępność serwera), jednak możesz użyć tagu meta „nosnippet” w pliku robots, aby uniemożliwić wyświetlanie fragmentu, lub tagu robots meta „noarchive”, aby wyłączyć zapisywanie strony w pamięci podręcznej. W przypadku wprowadzenia zmian na dotychczasowych i znanych stronach Googlebot będzie musiał ponownie zeskanować i zindeksować te strony, zanim zmiana stanie się widoczna w wynikach wyszukiwania.

Mamy nadzieję, że ten post pomoże Ci wyjaśnić niektóre procesy stosowane w narzędziu do usuwania adresów URL. W kolejnym poście na blogu pokażemy, jak poprosić o usunięcie treści, które nie należą do Ciebie. Zajrzyj tu znowu.

Jak zawsze, zachęcamy do przesyłania opinii i pytań na Forum pomocy dla webmasterów.

Warto też przeczytać artykuł o zarządzaniu informacjami o sobie dostępnymi w internecie.