Компенсация расширений, интерпретаций и оптимизаций по умолчанию.

Google Cloud Search имеет несколько расширений, интерпретаций и оптимизаций по умолчанию, которые влияют на результаты поиска. Если вы когда-нибудь увидите неожиданные результаты поисковых запросов, обратитесь к этому руководству, прежде чем обращаться в службу поддержки Cloud Search.

Расширения по умолчанию

Предположим, пользователь выполняет поиск, используя строку, например [PDF-файлы Джо], но некоторые возвращаемые результаты содержат выделенные слова, например «документы», вместо «PDF-файлы». Почему результаты содержат выделенные слова, которых нет в поисковый запрос?

По умолчанию Google Cloud Search, как и веб-поиск Google, ищет не только точные слова в запросе. Вместо этого Cloud Search расширяет запрос, включив в него синонимы и основы слов (даже если вы не внедрили свои собственные синонимы). Это расширение делается для получения документов, которые в целом соответствуют идее и цели запроса. После того, как этот широкий набор документов выбран, алгоритмы ранжирования работают так, чтобы лучшие совпадения помещались в начало набора результатов.

Когда пользователь искал [PDF-файлы Джо], Cloud Search предоставил следующие дополнительные допустимые слова:

  • Для [Джо] Cloud Search может также соответствовать словам «joe» (расширение основы) и «joes» (синоним, основанный на пунктуации).
  • Для [PDF-файлов] Cloud Search может также соответствовать словам «documents» (расширение синонима) и «pdf» (расширение основы).

По умолчанию синонимы не обязательно являются двунаправленными. Например, если пользователь ищет термин «фишинг», Cloud Search может найти «фишинг» в качестве расширения синонима. Однако если пользователь ищет термин «фишинг», Google может не найти «фишинг» в качестве расширения.

Расширения для слов с дефисом и без него

Когда пользователь ищет слова, написанные через дефис, а не их эквиваленты без дефиса, например [гардеробная] и [гардеробная), Cloud Search обрабатывает эти запросы по-разному.

Кроме того, для слов, написанных через дефис и подчеркнутых слов, таких как [walk-in] и [walk_in], используются различные оптимизации.

Компенсация расширений по умолчанию

По умолчанию нет никакой гарантии какого-либо расширения. Если вы хотите обеспечить двунаправленность синонимов или расширений синонимов для конкретного домена, создайте собственный набор синонимов для конкретного домена. Дополнительную информацию о реализации синонимов см. в разделе Определение синонимов .

Интерпретации по умолчанию

Cloud Search также обеспечивает интерпретацию на естественном языке, которая интерпретирует объекты, свойства и значения полей, используемые в запросе, в соответствии со схемой, загруженной для конкретного источника данных. Дополнительные сведения об этой интерпретации естественного языка см. в разделе Структурирование схемы для оптимальной интерпретации запросов .

Отключить переводы на естественный язык

Чтобы отключить интерпретацию естественного языка для определенного запроса, установите для QueryInterpretationOptions.disableNlInterpretation значение true в поисковом запросе.

Оптимизации по умолчанию

Cloud Search также предоставляет следующие оптимизации по умолчанию:

  • Смешение результатов, полученных путем исправления орфографии. Например, если строка запроса была [корпоративные преимущества], Cloud Search будет соответствовать слову «корпоративный» и правильному написанию слова «корпоративный».

  • Для запросов, которые не дают результатов или дают мало результатов, Cloud Search при сопоставлении результатов использует более допустимый набор связанных терминов, более широкий, чем прямые синонимы. Дополнительную информацию см. в разделе Обработка дополнительных результатов .

Нормализация документов и запросов

Нормализация означает стандартизацию определенных слов или фраз до или после выполнения запроса. Чтобы обеспечить более согласованные ответы на ваши запросы, рассмотрите возможность нормализации ваших документов (до или во время индексации) и запросов (после того, как пользователь сделал запрос) следующими способами:

  • Чтобы нормализовать документы:

    1. Выберите каноническое написание важных слов, используемых в документах в ваших репозиториях.
    2. Исправьте орфографию в документах исходного репозитория или при индексировании содержимого, чтобы она соответствовала каноническому написанию.
  • Чтобы нормализовать запросы:

    1. Перехватывайте запросы пользователей перед отправкой их в Cloud Search.
    2. Перепишите слова в пользовательских запросах, чтобы они соответствовали наиболее частому написанию в индексированном источнике данных.
    3. Отправьте запрос в Cloud Search.

Отключить расширения, интерпретации и оптимизации для всех запросов.

Чтобы отключить расширения, интерпретации и оптимизации для определенного запроса, установите для QueryInterpretationOptions.enableVerbatim Mode значение true в поисковом запросе.