Ответы на вопросы о поисковой оптимизации, сентябрь 2023 г.

Представляем текстовую версию ответов на вопросы о поисковой оптимизации от специалистов Google (это мероприятие прошло в сентябре 2023 г.). Если вы хотите получить рекомендации, касающиеся непосредственно вашего сайта, советуем задать вопрос на справочном форуме Центра Google Поиска.

Может ли Google по ошибке индексировать версию сайта с префиксом www?

Джон. Ван спрашивает: "Может ли Google по ошибке индексировать версию сайта с префиксом www? Страницы моего сайта в домене в зоне .my должны начинаться с префикса HTTP, но не должны содержать элемент www".

Здравствуйте, Ван! Я проверил ваш сайт. Похоже, на вашем сервере настроена автоматическая переадресация с версии без префикса www на версию с префиксом, помеченную атрибутом rel="canonical" в теге link. Если вы используете браузер Chrome, то можете не заметить префикса www в адресной строке, но если вы дважды нажмете на URL, то увидите его полную версию, содержащую www. На самом деле в этом нет ничего страшного: обе версии сайта – как с префиксом www, так и без него – равнозначны для Google Поиска.

Почему данные, к которым был применен фильтр, находятся выше, чем общие данные в Search Console?

Гэри. Орнелла интересуется: "Почему данные, к которым был применен фильтр, находятся выше, чем общие данные в Search Console, ведь это неправильно?"

Мне понравился ваш вопрос, но по другой причине. Если вкратце, то мы активно используем так называемые фильтры Блума: они позволяют нам экономить время и место, поскольку нам нужно обрабатывать большой объем данных. Если говорить конкретнее, то при работе с большим количеством объектов, число которых исчисляется миллиардами или даже триллионами, быстро найти нужные данные становится очень сложно. Фильтры Блума существенно облегчают эту задачу, позволяя искать объекты в другом наборе, в котором содержится хеш вероятных объектов основного набора. Если сначала просматривать хеш, то процесс значительно ускорится, а поскольку хеширование нередко сопровождается потерей данных – как преднамеренной, так и нет, – то вам приходится просматривать меньше данных. В свою очередь, это позволяет делать более точные прогнозы относительно существования чего-либо в основном наборе. То есть фильтры Блума ускоряют поиск, предсказывая, существует ли определенный элемент в основном наборе данных, но делается это ценой снижения точности, поскольку чем меньше набор данных, тем выше точность прогноза.

Почему страницы моих сайтов на платформе Google не индексируются должным образом?

Джон. Мы получили вопрос на французском языке, автор которого хочет узнать, почему страницы его ресурсов на Google Сайтах не индексируются должным образом.

Мы рады, что нам поступают вопросы на разных языках. Для начала замечу, что страницы, созданные на Google Сайтах, могут быть проиндексированы и обычно попадают в индекс Google Поиска. Однако URL из Google Сайтов сложно отслеживать, поскольку общедоступный URL страницы может не соответствовать тому, который используется в вашем аккаунте после входа. По правде говоря, хотя технически такие страницы могут быть проиндексированы, они не идеальны с точки зрения поисковой оптимизации, и в Search Console сложно собирать сведения о них. Если поисковая оптимизация важна для вас, возможно, вам стоит рассмотреть другие варианты и тщательно взвесить все "за" и "против". Чтобы отслеживать эффективность в Search Console, вы можете также использовать собственное доменное имя для размещения контента из Google Сайтов. Это упростит перенос сайта, если вы решите его осуществить, и позволит подтвердить в Search Console права собственности на весь домен .

Гэри. Сарабджит хочет узнать: "На нашем сайте много кнопок, при нажатии на которые генерируются ссылки на другие страницы. Сканирует ли Google эти ссылки?"

Если вкратце, то Googlebot не нажимает на кнопки.

Нарушает ли правила Google гостевая публикация, размещенная с целью получения обратной ссылки, если она содержит полезную информацию?

Джон. Брук спрашивает: "На большинстве сайтов сегодня есть возможность приобрести гостевую публикацию для размещения обратной ссылки. Противоречит ли такая публикация правилам Google, если она содержит полезную информацию?"

Здравствуйте, Брук! Спасибо за вопрос. Вы мыслите в правильном направлении. Действительно, использование гостевых публикаций для размещения ссылок противоречит нашим правилам в отношении веб-спама. В частности, вы должны правильным образом помечать такие ссылки, чтобы они не влияли на результаты поиска. Это можно сделать при помощи атрибутов rel=nofollow и rel=sponsored. Не запрещается использовать рекламу для продвижения сайта, но при этом ссылки должны быть заблокированы указанными выше способами.

Может ли контент на странице категорий товаров в интернет-магазине положительно повлиять на общий рейтинг сайта?

Гэри. Брук интересуется: "Может ли контент на странице категорий товаров в интернет-магазине положительно повлиять на общий рейтинг сайта?"

Вы можете добавлять любой контент на страницах категорий товаров, но старайтесь не размещать на них одни и те же некачественные, автоматически сгенерированные фрагменты текста. Это выглядит нелепо даже с точки зрения среднестатистического пользователя. При этом выбирайте такие материалы, которые могут быть полезными для посетителей, а не только такие, которые предположительно улучшат позиции вашего сайта в Поиске. Также ознакомьтесь с нашими рекомендациями для интернет-магазинов.

Может ли неправильное использование семантических тегов помешать Google понять, о чем сайт?

Джон. Следующий вопрос звучит так: "Может ли неправильное использование семантических тегов помешать Google понять содержание страниц и отнести его к нужной категории? В частности, теги <hr> указывают на смену темы, но я могу использовать их только для оформления".

Это интересный вопрос. В целом правильное использование семантических HTML-тегов помогает поисковым системам понять содержание страницы и ее контекст. Например, если вы разметите заголовки на странице, то они могут послужить четким сигналом о том, что ваш контент соответствует тому или иному заголовку. Разумеется, одно лишь это не поможет вам занять первые позиции в рейтинге, но если нам будет сложно понять, о чем ваш контент, то краткое резюме в форме заголовков может оказаться весьма полезным. Мы рекомендуем всегда использовать семантические теги на сайте, чтобы мы могли обратиться к ним при сложностях с интерпретацией страницы. Но предположим, что семантические HTML-теги внедрены неправильно. Помешает ли это поисковым системам понять, о чем ваш сайт? Вероятно, даже в этом случае вы просто не заметите разницу. Если тематику контента по каким-либо причинам сложно интерпретировать, упростите нам решение этой задачи, добавив на страницу семантическую структуру. Что касается вашего примера с тегами <hr>, то мне не приходит в голову ни одной ситуации, в которой их неправильное использование помешало бы понять содержание страницы. И хотя велика вероятность того, что веб-дизайнер допустит ошибки при использовании тегов <hr>, я полагаю, что это не принесет большого вреда. Думаю, что мой ответ, который в целом означает "зависит от ситуации", был достаточно подробен.

В отчете Google Search Console для страниц 404 содержится много URL, которые выглядят как фрагменты кода JSON или JavaScript. Это нормально?

Гэри. Реза задает вопрос: "В отчете Google Search Console для страниц 404 содержатся URL, которые выглядят как фрагменты кода JSON или JavaScript. Это нормально?"

Да. Вы можете либо игнорировать эти URL, либо задать для них заголовок HTTP-ответа noindex.

Джон. Друв хочет узнать: "Может ли файл индекса Sitemap содержать ссылки на файлы Sitemap на других доменах?"

Здравствуйте, Друв! Интересный вопрос. Наш ответ: "Возможно". Но мы рекомендуем другое решение. Чтобы отправить нам файлы Sitemap, содержащие URL с разных доменов, можно использовать файл robots.txt или подтвердить право собственности на все домены в Search Console. Информация о праве собственности в Search Console может быть не видна при анализе сайта, поэтому о том, что она настроена, бывает легко забыть. Если вы работаете над файлами Sitemap и не хотите использовать данный способ, рекомендую добавить в файл Sitemap комментарий в формате XML, чтобы не забыть об этих требованиях и случайно не нарушить их в будущем. Поскольку Search Console является сервисом Google, вам также стоит ознакомиться с требованиями других поисковых систем.

Как снизить вероятность того, что Google будет использовать собственное метаописание для сайта?

Гэри. Вопрос от Сэма Бауэрса: "Как снизить вероятность того, что Google будет использовать собственное метаописание для сайта?"

Хороший вопрос. Зачастую, хотя и не всегда, алгоритмы Google используют ваше метаописание, если страница не очень велика или если метаописание в большей степени соответствует запросу пользователя, чем содержание страницы. Рекомендуем ознакомиться с дополнительной информацией об описаниях и фрагментах.

Можно ли сообщить поисковым роботам, чтобы они не сканировали определенные разделы страницы?

Джон. Следующий вопрос звучит так: "Можно ли сообщить поисковым роботам, чтобы они не сканировали определенные разделы страницы, но при этом она оставалась доступной для сканирования и индексирования?" Далее владелец сайта уточняет, что в большом меню много повторяющегося контента и он хотел бы заблокировать его.

Да, вы можете предотвратить индексирование определенных частей страницы, но для таких общих элементов, как заголовки, меню, боковые панели и нижние колонтитулы, этого делать не требуется. Поисковые системы умеют эффективно обрабатывать сайты в том виде, в котором они существуют, и большое меню или объемный нижний колонтитул не являются проблемой. Если же вы хотите скрыть другие элементы страницы, то можете либо разместить их в окне iframe, заблокировав источник его содержания в файле robots.txt, либо с помощью JavaScript извлекать для них контент, сканирование которого запрещено файлом robots.txt. Если вы просто хотите, чтобы какие-либо материалы не появлялись в описании страницы, помечайте их с помощью атрибута data-nosnippet. Однако ещё раз напомню: вам не нужны все эти сложности, если вы просто не хотите индексировать меню, иначе в какой-то момент может возникнуть непредвиденная ошибка. Используйте описанные выше способы тогда, когда в этом действительно есть необходимость.

Стоит ли использовать бесконечную прокрутку на веб-страницах? Влияет ли она на бесплатный трафик и создает ли трудности роботу Googlebot?

Гэри. Джиту спрашивает: "Стоит ли использовать бесконечную прокрутку на веб-страницах? Влияет ли она на бесплатный трафик и создает ли трудности роботу Googlebot?"

Все зависит от того, как именно внедрена бесконечная прокрутка. Если каждый фрагмент или виртуальная страница доступны и могут быть найдены по уникальному URL, то бесконечная прокрутка не приведет к проблемам.

Джон. Райан интересуется: "Если некоторые ссылки на главной странице сайта отображаются в мобильной версии, но скрыты при помощи JavaScript в версии для компьютеров и становятся активны только после нажатия на них, то считает ли Google такие ссылки менее ценными?"

Привет, Райан! В рамках индексирования с приоритетом мобильного контента мы при индексировании и обнаружении ссылок ориентируемся именно на мобильную версию страницы. Если она содержит нужные материалы в полном объеме, то вам не о чем беспокоиться. Честно говоря, я удивлен тем, что версия сайта для компьютеров содержит меньше контента, но наверняка у вас на это есть причины.

Индексирует ли Google PDF-файлы, которые сохранены на Google Диске, но не размещены на сайте?

Гэри. Вопрос от анонимного пользователя: "Индексирует ли Google PDF-файлы, которые сохранены на Google Диске, но не размещены на сайте? Если да, то сколько времени это может занять?"

Да, Google может проиндексировать общедоступные PDF-файлы, размещенные на Google Диске, как и любой другой URL на сайте. Так же, как и с любым URL, это может занять от нескольких секунд до бесконечности.

Как Google сканирует контент, в котором используется скролджекинг, и влияет ли такой тип оформления на оценку сайта с точки зрения его удобства для пользователей?

Джон. Мэтт задает вопрос: "В интернете все чаще попадаются страницы со скролджекингом, то есть измененными настройками прокрутки. Насколько я понимаю, это не очень удобно для пользователей. А как Google сканирует такой контент, и влияет ли скролджекинг на оценку сайта с точки зрения его удобства для пользователей?" Мэтт также прикрепил ссылку на статью о скролджекинге, которую я приведу ниже.

Привет, Мэтт! Это интересный вопрос. Я не знал, что у этого типа оформления есть специальное название (скролждекинг), так что спасибо за ссылку. Мы не считаем это проблемой, поэтому я не думаю, что скролджекинг может напрямую повлиять на позиции сайта. Однако вы можете столкнуться с косвенными последствиями использования такого оформления. Например, Google отрисовывает страницы, загружая их на очень большом виртуальном мобильном устройстве. Если контент не показывается на странице из-за проблем с прокруткой, то наши системы могут посчитать, что он невидим для пользователей. То есть я бы рассматривал это как потенциальную проблему с отображением контента, а не его качеством.

Почему URL, доступ к которому заблокирован в моем аккаунте Google Search Console с помощью файла robots.txt, содержится в индексе Google?

Гэри. Дениз Джан Арал спрашивает: "Почему URL, доступ к которому заблокирован файлом robots.txt в моем аккаунте Google Search Console, содержится в индексе Google?"

Этот вопрос возникает довольно часто: Google может проиндексировать URL, но только URL, а не контент, даже если файл robots.txt запрещает сканирование этого URL. Таких URL в нашем индексе совсем немного, поскольку подобная ситуация возникает только в том случае, когда заблокированную страницу часто ищут пользователи в интернете. Если вас это не устраивает, разрешите сканирование URL и используйте правило noindex в заголовках HTTP-ответа или теге <meta>.

На нашем сайте опубликован нежелательный контент, сгенерированный с помощью ИИ. Как исправить его или удалить с сайта?

Джон. Соня интересуется: "Мы наняли копирайтеров, но они предоставили нам контент, сгенерированный ИИ. Как это исправить? Нам следует просто удалить этот контент, заменить его новым или создать новый сайт по новому адресу? Помогите!"

Даже не знаю, что сказать, Соня. Похоже, вы без проверки опубликовали контент, созданный внешними авторами. Не стоит так делать, даже если он не сгенерирован с помощью ИИ. Так или иначе, если вы опубликовали некачественные материалы, но не хотите, чтобы они оставались на вашем сайте, то можете либо исправить, либо удалить их. Предлагаю также посмотреть на ситуацию под другим углом: возможно, в интернете недостает такого контента и ваш сайт окажется полезен для пользователей? Или же это просто переписанный текст, который уже есть на сайтах? Если это так, то зачем поисковым системам индексировать его и тем более показывать в результатах поиска? Также следует помнить, что качественный сайт – это не только хорошие статьи. Чтобы добиваться своих целей, вы должны создать четкую стратегию и функциональные рабочие процессы.

Время от времени количество проиндексированных URL на нашем сайте резко возрастает. В чем может быть причина?

Гэри. Вот что хочет узнать Лоренцо: "Время от времени количество проиндексированных URL на нашем сайте резко возрастает. В чем может быть причина?"

Возможно, у нас появилось больше жестких дисков или освободилось место или же мы просто обнаружили эти новые URL. Сложно сказать. В любом случае это повод выпить бокал шампанского! Отмечайте свои достижения!

Может ли Google использовать несколько файлов разного размера для значка сайта?

Джон. Дэйв спрашивает: "Может ли Google использовать несколько файлов разного размера для значка сайта? Сможет ли он распознать несколько таких значков, помеченных атрибутом sizes, и выбрать подходящий?"

Привет, Дэйв! Технически формат файлов .ico позволяет отправлять нам несколько файлов с разными разрешениями. Однако я полагаю, что лучше указывать определенные размеры и файлы, поскольку количество размеров, используемых в разных целях, может быть значительным. Google позволяет указывать несколько размеров для значка сайта в HTML-коде, поэтому если вы хотите предоставить файлы определенных размеров, то у вас не должно возникнуть проблем.

Если разделы сайта управляются с помощью разных систем управления контентом, то будет ли Google оценивать эти разделы по-разному?

Гэри. Вивьен интересуется: "Если разделы сайта управляются с помощью разных систем управления контентом, то будет ли Google оценивать эти разделы по-разному?"

Нет.

В Google Поиске вместо главной страницы нашего сайта показывается PDF-файл для скачивания. Можно ли это изменить?

Джон. Анна задает вопрос: "Нам требуется, чтобы Google повторно просканировал сайт нашего фонда, так как в результатах поиска вместо главной страницы сайта отображается PDF-файл для скачивания. Это сайт фонда по защите прав человека в Дании. Можно ли изменить результаты поиска?"

Здравствуйте, Анна! Дело в том, что на главную страницу вашего сайта добавлен тег <meta> с атрибутами robots и noindex, поэтому вместо нее в результатах поиска показывается другая страница сайта. Этот тег <meta> предотвращает индексирование главной страницы. После того как вы его удалите, ситуация быстро изменится.

Когда я ищу свой сайт в Google, то на первом месте в результатах поиска оказывается страница товара, а не стартовая страница. Почему?

Джон. Жюльен спрашивает: "Когда я ищу свой сайт в Google, то на первом месте в результатах поиска оказывается страница товара, а не стартовая страница. Почему, ведь страница товара даже не оптимизирована для поиска – в отличие от стартовой?"

Здравствуйте, Жюльен! Чтобы определить, какие страницы сайта в наибольшей степени соответствуют определенным запросам пользователей, Google учитывает ряд факторов. В контексте поиска информации одно из ключевых понятий – предполагаемое намерение пользователя. Если вкратце, то это цель, которую он преследовал, отправляя тот или иной запрос. Искал ли пользователь информацию о товаре или компании? Возможно, он хотел сразу что-то купить? В разное время намерение пользователя может отличаться даже в случае одинаковых запросов. В целом это означает, что даже страница без поисковой оптимизации может появляться в результатах поиска, если в нужный момент она будет соответствовать запросу. Поэтому я бы рекомендовал вам проанализировать, как пользователи приходят на ваш сайт, и предоставить им нужный контент и удобный интерфейс независимо от того, на какой странице они оказываются.

Мне пришло предупреждение от Search Console о том, что мне необходимо устранить проблемы с INP. Как рассчитывается этот показатель и что мне лучше предпринять?

Джон. Вопрос от Алехандро: "Здравствуйте, Джон и команда Google! Сегодня я получил предупреждение в Search Console о том, что мне необходимо устранить проблемы с INP. Как рассчитывается этот показатель и что мне лучше предпринять?"

Чтобы ответить на этот вопрос, рекомендую ознакомиться со справочными материалами, посвященными показателю INP (Interaction to Next Paint), на сайте web.dev. Это позволит вам понять, как улучшить этот показатель. Помните, что INP пока ещё не относится к основным интернет-показателям (Core Web Vitals) и что эти показатели – далеко не единственные факторы, определяющие удобство страниц сайта и оцениваемые системами определения полезного контента. Более высокий показатель INP будет означать, что сайт с большей вероятностью понравится посетителям, но не обязательно обеспечит ему более высокие позиции в результатах поиска.

Как удалить 30 тысяч URL из Google Search Console после взлома с добавлением японских ключевых слов?

Джон. Хизер спрашивает: "Как удалить 30 тысяч URL из Google Search Console после взлома с добавлением японских ключевых слов?"

Привет, Хизер! Сожалею, что ваш сайт взломали. Надеюсь, вам удалось решить проблему, но если нет, то ознакомьтесь с нашими справочными материалами об этом типе взлома, размещенными на сайте web.dev. Я укажу ссылку на них. Помните, что контент, взломанный в результате такой хакерской атаки, скрыт от Google, поэтому вам может потребоваться помощь, чтобы проверить, действительно ли он удален. Что касается результатов поиска, то в свете количества взломанных страниц я бы рекомендовал сосредоточиться на самых популярных из них и вручную устранить проблему, удалив их или запросив повторное индексирование. Остальные будут удалены из индекса уже без вашего участия. Тем не менее взломанный контент (если вы будете искать именно его) будет появляться в результатах поиска ещё какое-то время, но обычные пользователи вряд будут отправлять подобные запросы, поэтому важно устранить проблему на страницах, которые просматривают чаще всего.

Почему после отправки запроса на индексирование в Search Console мои страницы удаляются из индекса? Это происходит уже несколько раз.

Джон. Вопрос от Грейс: "Почему после отправки запроса на индексирование в Search Console мои страницы удаляются из индекса? Это происходит уже несколько раз".

Здравствуйте, Грейс! Без доступа к самим страницам сказать сложно, но причина может быть в том, что наши системы не могут определить, насколько полезным является ваш сайт и размещенный на нем контент. Мы почти никогда не индексируем все без исключения страницы сайта, поэтому отсутствие некоторых из них в индексе – это нормально. Даже если страницы попадут в индекс, с течением времени наши алгоритмы проведут повторную оценку контента и сайта и могут снова удалить их. Лучшим решением было бы не пытаться снова и снова добавить эти страницы в индекс, а сосредоточиться на повышении качества сайта, чтобы он был по-настоящему полезным для пользователей. Если на сайте будет по-настоящему интересный и оригинальный контент, мы добавим его в индекс автоматически.