В Google Cloud Search есть несколько стандартных расширений, интерпретаций и оптимизаций, которые влияют на результаты поиска. Если вы видите неожиданные результаты поиска, перед обращением в службу поддержки Cloud Search ознакомьтесь с этим руководством.
В этом документе запросы пользователей указываются в скобках (например, [query] ), а интерпретации системы — в кавычках (например, "interpretation" ).
Результаты запроса в этом документе являются иллюстративными примерами поведения и дают представление о том, как работают расширения, интерпретации и оптимизации; фактические результаты могут отличаться.
Расширения по умолчанию
Предположим, пользователь ищет [Joe's PDFs] , но некоторые результаты содержат выделенные слова, такие как "documents" вместо "PDFs" . Это происходит потому, что Cloud Search расширяет запрос, включая синонимы и основы слов, подобно поиску Google. Это расширение помогает найти документы, соответствующие идее и смыслу запроса. Затем алгоритмы ранжирования гарантируют, что лучшие совпадения будут отображаться вверху списка.
Когда пользователь ищет [Joe's PDFs] , Cloud Search может добавить следующие слова:
- В случае с
[Joe's]это может соответствовать"joe"(расширение основы) и"joes"(синоним, основанный на пунктуации). - Для
[PDFs]это может соответствовать"documents"(расширение синонимов) и"pdf"(расширение основы слова).
Синонимы по умолчанию не всегда являются двунаправленными. Например, поиск по запросу [phishing] может дать результат "phish" , но поиск по запросу [phish] может не дать результат "phishing" .
Расшифровка слов, написанных через дефис и подчёркнутых.
Cloud Search обрабатывает слова с дефисом и их эквиваленты без дефиса по-разному, например, [walk-in closet] и [walk in closet] . Он также применяет различные оптимизации для слов с дефисом и с подчеркиванием, например, [walk-in] и [walk_in] .
Компенсация расширений по умолчанию
Cloud Search не гарантирует какого-либо конкретного расширения. Для обеспечения двунаправленного использования синонимов или расширения, специфичного для конкретной области, создавайте собственные синонимы. Для получения дополнительной информации см. раздел «Определение синонимов» .
Интерпретации по умолчанию
Cloud Search обеспечивает интерпретацию на естественном языке на основе схемы вашего источника данных. Для получения дополнительной информации см. раздел «Структурируйте свою схему для оптимальной интерпретации запросов» .
Отключить интерпретацию естественного языка
Чтобы отключить интерпретацию на естественном языке для конкретного запроса, установите QueryInterpretationOptions.disableNlInterpretation в true в поисковом запросе.
Оптимизация по умолчанию
Cloud Search предоставляет следующие оптимизации по умолчанию:
Исправление орфографических ошибок: Для запроса
[corpoate benefits]Cloud Search находит слово"corpoate"и правильное написание"corporate".Дополнительные результаты: Для запросов с небольшим количеством результатов или без них Cloud Search использует разрешительный набор связанных терминов. Дополнительную информацию см. в разделе «Обработка дополнительных результатов» .
Нормализация документов и запросов
Нормализация стандартизирует слова или фразы до или после запроса. Для обеспечения согласованности ответов следует учитывать следующие шаги нормализации:
Для нормализации документов:
- Выберите каноническое написание ключевых слов в ваших репозиториях.
- Исправьте орфографические ошибки в исходных документах или при индексировании, чтобы они соответствовали канонической форме.
Для нормализации запросов:
- Перехватывайте запросы пользователей перед отправкой их в Cloud Search.
- Переписывайте слова в запросах таким образом, чтобы они соответствовали наиболее распространенному написанию в индексированном источнике данных.
- Отправьте переписанный запрос в Cloud Search.
Отключить расширения, интерпретации и оптимизации.
Чтобы отключить эти функции для конкретного запроса, установите параметр QueryInterpretationOptions.enableVerbatimMode в true в поисковом запросе.