Компенсация расширений, интерпретаций и оптимизаций по умолчанию.

В Google Cloud Search есть несколько стандартных расширений, интерпретаций и оптимизаций, которые влияют на результаты поиска. Если вы видите неожиданные результаты поисковых запросов, ознакомьтесь с этим руководством, прежде чем обращаться в службу поддержки Cloud Search.

Расширения по умолчанию

Предположим, пользователь выполняет поиск, используя строку, например, [PDF-файлы Джо], но некоторые возвращенные результаты содержат выделенные слова, например, «документы» вместо «PDF-файлы». Почему результаты содержат выделенные слова, которых не было в поисковом запросе?

По умолчанию Google Cloud Search, как и Google Web Search, ищет не только точные слова в запросе. Вместо этого Cloud Search расширяет запрос, включая синонимы и основы слов (даже если вы не добавили собственные синонимы). Это расширение выполняется для поиска документов, которые в целом соответствуют идее и цели запроса. После выбора этого широкого набора документов алгоритмы ранжирования обеспечивают размещение наиболее подходящих вариантов в верхней части списка результатов.

Когда пользователь искал [PDF-файлы Джо], Cloud Search предложил следующие дополнительные приемлемые слова:

  • Для [Joe's] Cloud Search также может сопоставить «joe» (расширение основы) и «joes» (синоним, основанный на пунктуации).
  • Для [PDF-файлов] Cloud Search может также соответствовать «documents» (расширение синонима) и «pdf» (расширение основы).

По умолчанию синонимы не обязательно являются двунаправленными. Например, если пользователь ищет термин «фишинг», Cloud Search может найти «phish» как расширение синонима. Однако если пользователь ищет термин «фишинг», Google может не найти «phishing» как расширение.

Расширения для слов с дефисом и без дефиса

Когда пользователь ищет слова, написанные через дефис, а не их эквиваленты без дефиса, например [walk-in closet] и [walk in closet], Cloud Search обрабатывает эти запросы по-разному.

Кроме того, для слов с дефисом и подчеркиванием, таких как [walk-in] и [walk_in], используются различные оптимизации.

Компенсация расширений по умолчанию

По умолчанию никаких гарантий расширения не предоставляется. Если вы хотите обеспечить двунаправленность синонимов или расширения синонимов, специфичных для домена, создайте собственный набор синонимов, специфичных для домена. Подробнее о реализации синонимов см. в разделе «Определение синонимов» .

Интерпретации по умолчанию

Cloud Search также обеспечивает интерпретацию на естественном языке, которая интерпретирует объекты, свойства и значения полей, используемые в запросе, в соответствии со схемой, загруженной для конкретного источника данных. Подробнее об этой интерпретации на естественном языке см. в статье «Структурирование схемы для оптимальной интерпретации запроса» .

Отключить интерпретацию на естественном языке

Чтобы отключить интерпретацию естественного языка для определенного запроса, установите для QueryInterpretationOptions.disableNlInterpretation значение true в поисковом запросе.

Оптимизации по умолчанию

Cloud Search также предоставляет следующие оптимизации по умолчанию:

  • Объединение результатов, полученных с помощью коррекции орфографии. Например, если строка запроса была [корпоративные льготы], Cloud Search выдаст совпадение по слову «корпоративный» и правильному написанию слова «корпоративный».

  • Для запросов, по которым результаты не возвращаются или даются лишь частично, Cloud Search использует более широкий набор связанных терминов, чем прямые синонимы, при сопоставлении результатов. Подробнее см. в разделе Обработка дополнительных результатов .

Нормализация документов и запросов

Нормализация подразумевает стандартизацию определённых слов или фраз до или после выполнения запроса. Чтобы обеспечить более единообразные ответы на запросы, рассмотрите возможность нормализации документов (до или во время индексации) и запросов (после того, как пользователь выполнил запрос) следующими способами:

  • Для нормализации документов:

    1. Выберите каноническое написание для критических слов, используемых в документах в ваших репозиториях.
    2. Исправьте орфографию в исходных документах репозитория или при индексировании контента, чтобы она соответствовала каноническому правописанию.
  • Для нормализации запросов:

    1. Перехватывайте пользовательские запросы перед отправкой их в Cloud Search.
    2. Перепишите слова в пользовательских запросах так, чтобы они соответствовали наиболее распространенному написанию в индексированном источнике данных.
    3. Отправьте запрос в Cloud Search.

Отключить расширения, интерпретации и оптимизации для всех запросов

Чтобы отключить расширения, интерпретации и оптимизации для конкретного запроса, установите для QueryInterpretationOptions.enableVerbatim Mode значение true в поисковом запросе.