Сканирование страниц с региональными настройками
Если контент на страницах вашего сайта меняется в зависимости от региональных настроек посетителя, некоторые языковые версии могут остаться непросканированными. Причина заключается в том, что по умолчанию робот Googlebot отправляет HTTP-запросы с американских IP-адресов и не использует заголовок запросов Accept-Language
.
Региональные настройки и робот Googlebot
Googlebot использует IP-адреса, относящиеся не только к США, но и к другим странам.
Мы советуем отвечать на запросы робота Googlebot из определенной страны так же, как на запросы обычных пользователей. К примеру, если вы запрещаете доступ к своему контенту пользователям из США, но разрешаете просматривать его жителям Австралии, те же самые настройки должны применяться к роботам Googlebot из этих двух стран.
Дополнительные рекомендации
- У робота Googlebot одна и та же строка агента пользователя независимо от конфигурации сканирования. Подробнее о строках агентов пользователя, которые идентифицируют поисковых роботов Google…
- Вы можете проверить, действительно ли запрос из определенного региона отправлен роботом Googlebot, – это делается с помощью обратного DNS-запроса.
- Рекомендуем во всех языковых версиях задать одни и те же исключения для роботов, то есть указать одинаковые правила в тегах robots (
meta
) и в файле robots.txt.