Compensar por expansiones, interpretaciones y optimizaciones predeterminadas

Google Cloud Search tiene varias expansiones, interpretaciones y optimizaciones predeterminadas que afectan los resultados de la búsqueda. Si ves resultados inesperados de las consultas de búsqueda, consulta esta guía antes de comunicarte con el equipo de asistencia de Cloud Search.

Expansiones predeterminadas

Supongamos que un usuario realiza una búsqueda con una cadena, como [PDFs de José], pero algunos de los resultados que se muestran contienen palabras destacadas, como "documentos", en lugar de "PDFs". ¿Por qué los resultados contienen las palabras destacadas que no estaban en la búsqueda?

De forma predeterminada, Google Cloud Search, al igual que la Búsqueda web de Google, no solo busca las palabras exactas de una consulta. En cambio, Cloud Search expande la consulta para incluir sinónimos y raíces de palabras (incluso si no implementaste tus propios sinónimos). Esta expansión se realiza para recuperar documentos que coincidan de forma general con la idea y el propósito de la consulta. Después de seleccionar este amplio conjunto de documentos, los algoritmos de clasificación trabajan para garantizar que las mejores coincidencias se coloquen en la parte superior del conjunto de resultados.

Cuando el usuario buscó [PDFs de José], Cloud Search proporcionó lo siguiente como palabras aceptables adicionales:

  • En el caso de [Joe's], Cloud Search también podría coincidir con "joe" (una expansión de raíz) y "joes" (un sinónimo basado en la puntuación).
  • En el caso de [PDFs], Cloud Search también podría mostrar resultados relacionados con "documentos" (una expansión de sinónimos) y "pdf" (una expansión de raíz).

De forma predeterminada, los sinónimos no son necesariamente bidireccionales. Por ejemplo, si un usuario busca el término “phishing”, la Búsqueda en la nube podría hacer coincidir “phish” como una expansión de sinónimos. Sin embargo, si el usuario busca el término "phish", es posible que Google no coincida con "phishing" como una expansión.

Expansiones para palabras con guiones y sin guiones

Cuando el usuario busca palabras con guiones en comparación con sus equivalentes sin guiones, como [walk-in closet] y [walk in closet], Cloud Search trata estas consultas de manera diferente.

Además, se usan diferentes optimizaciones para las palabras con guiones y guiones bajos, como [walk-in] y [walk_in].

Compensa las expansiones predeterminadas

No hay garantía de ninguna expansión de forma predeterminada. Si deseas asegurarte de que los sinónimos o las expansiones de sinónimos específicos del dominio sean bidireccionales, crea tu propio conjunto de sinónimos específicos del dominio. Para obtener más información sobre la implementación de sinónimos, consulta Define sinónimos.

Interpretaciones predeterminadas

Cloud Search también proporciona una interpretación de lenguaje natural que interpreta los objetos, las propiedades y los valores de campo que se usan en una consulta según el esquema subido para una fuente de datos en particular. Si quieres obtener más información sobre esta interpretación de lenguaje natural, consulta Diseña la estructura de tu esquema para optimizar la interpretación de consultas.

Inhabilita las interpretaciones de lenguaje natural

Para inhabilitar las interpretaciones de lenguaje natural para una consulta específica, establece QueryInterpretationOptions.disableNlInterpretation en true en la solicitud de búsqueda.

Optimizaciones predeterminadas

Cloud Search también proporciona estas optimizaciones predeterminadas:

  • Combinación de los resultados proporcionados por la corrección ortográfica Por ejemplo, si la cadena de consulta fuera [beneficios corporativos], Cloud Search coincidiría con “corporate” y la ortografía correcta de “corporate”.

  • En el caso de las consultas que no generarían ningún resultado o pocos, Cloud Search usa un conjunto más permisivo de términos relacionados, más amplio que los sinónimos directos, cuando busca coincidencias en los resultados. Para obtener más información, consulta Cómo controlar los resultados complementarios.

Normaliza documentos y consultas

La normalización se refiere a la estandarización de ciertas palabras o frases, ya sea antes o después de realizar una consulta. Para garantizar respuestas más coherentes a tus consultas, considera normalizar tus documentos (antes o durante la indexación) y las consultas (después de que el usuario las realiza) de las siguientes maneras:

  • Para normalizar documentos, sigue estos pasos:

    1. Elige una ortografía canónica para las palabras importantes que se usan en los documentos de tus repositorios.
    2. Corrige la ortografía en los documentos del repositorio de origen o cuando indexes el contenido para que coincida con la ortografía canónica.
  • Para normalizar las consultas, haz lo siguiente:

    1. Intercepta las consultas de los usuarios antes de enviarlas a Cloud Search.
    2. Vuelve a escribir las palabras en las búsquedas de los usuarios para que coincidan con la ortografía más común en la fuente de datos indexada.
    3. Envía la consulta a Cloud Search.

Inhabilita las expansiones, las interpretaciones y las optimizaciones para todas las consultas

Para inhabilitar las expansiones, las interpretaciones y las optimizaciones de una consulta específica, configura QueryInterpretationOptions.enableVerbatim Mode en true en la solicitud de búsqueda.