Компенсация расширений, интерпретаций и оптимизаций по умолчанию.

В Google Cloud Search есть несколько стандартных расширений, интерпретаций и оптимизаций, которые влияют на результаты поиска. Если вы видите неожиданные результаты поиска, перед обращением в службу поддержки Cloud Search ознакомьтесь с этим руководством.

В этом документе запросы пользователей указываются в скобках (например, [query] ), а интерпретации системы — в кавычках (например, "interpretation" ).

Результаты запроса в этом документе являются иллюстративными примерами поведения и дают представление о том, как работают расширения, интерпретации и оптимизации; фактические результаты могут отличаться.

Расширения по умолчанию

Предположим, пользователь ищет [Joe's PDFs] , но некоторые результаты содержат выделенные слова, такие как "documents" вместо "PDFs" . Это происходит потому, что Cloud Search расширяет запрос, включая синонимы и основы слов, подобно поиску Google. Это расширение помогает найти документы, соответствующие идее и смыслу запроса. Затем алгоритмы ранжирования гарантируют, что лучшие совпадения будут отображаться вверху списка.

Когда пользователь ищет [Joe's PDFs] , Cloud Search может добавить следующие слова:

  • В случае с [Joe's] это может соответствовать "joe" (расширение основы) и "joes" (синоним, основанный на пунктуации).
  • Для [PDFs] это может соответствовать "documents" (расширение синонимов) и "pdf" (расширение основы слова).

Синонимы по умолчанию не всегда являются двунаправленными. Например, поиск по запросу [phishing] может дать результат "phish" , но поиск по запросу [phish] может не дать результат "phishing" .

Расшифровка слов, написанных через дефис и подчёркнутых.

Cloud Search обрабатывает слова с дефисом и их эквиваленты без дефиса по-разному, например, [walk-in closet] и [walk in closet] . Он также применяет различные оптимизации для слов с дефисом и с подчеркиванием, например, [walk-in] и [walk_in] .

Компенсация расширений по умолчанию

Cloud Search не гарантирует какого-либо конкретного расширения. Для обеспечения двунаправленного использования синонимов или расширения, специфичного для конкретной области, создавайте собственные синонимы. Для получения дополнительной информации см. раздел «Определение синонимов» .

Интерпретации по умолчанию

Cloud Search обеспечивает интерпретацию на естественном языке на основе схемы вашего источника данных. Для получения дополнительной информации см. раздел «Структурируйте свою схему для оптимальной интерпретации запросов» .

Отключить интерпретацию естественного языка

Чтобы отключить интерпретацию на естественном языке для конкретного запроса, установите QueryInterpretationOptions.disableNlInterpretation в true в поисковом запросе.

Оптимизация по умолчанию

Cloud Search предоставляет следующие оптимизации по умолчанию:

  • Исправление орфографических ошибок: Для запроса [corpoate benefits] Cloud Search находит слово "corpoate" и правильное написание "corporate" .

  • Дополнительные результаты: Для запросов с небольшим количеством результатов или без них Cloud Search использует разрешительный набор связанных терминов. Дополнительную информацию см. в разделе «Обработка дополнительных результатов» .

Нормализация документов и запросов

Нормализация стандартизирует слова или фразы до или после запроса. Для обеспечения согласованности ответов следует учитывать следующие шаги нормализации:

  • Для нормализации документов:

    1. Выберите каноническое написание ключевых слов в ваших репозиториях.
    2. Исправьте орфографические ошибки в исходных документах или при индексировании, чтобы они соответствовали канонической форме.
  • Для нормализации запросов:

    1. Перехватывайте запросы пользователей перед отправкой их в Cloud Search.
    2. Переписывайте слова в запросах таким образом, чтобы они соответствовали наиболее распространенному написанию в индексированном источнике данных.
    3. Отправьте переписанный запрос в Cloud Search.

Отключить расширения, интерпретации и оптимизации.

Чтобы отключить эти функции для конкретного запроса, установите параметр QueryInterpretationOptions.enableVerbatimMode в true в поисковом запросе.