Compensar por expansiones, interpretaciones y optimizaciones predeterminadas

Google Cloud Search tiene varias expansiones, interpretaciones y optimizaciones predeterminadas que afectan los resultados de la búsqueda. Si alguna vez ves resultados inesperados de búsquedas, consulta esta guía antes de comunicarte con el equipo de asistencia de Cloud Search.

Expansiones predeterminadas

Supongamos que un usuario realiza una búsqueda con una cadena, como [PDF de Joe], pero algunos resultados que se muestran contienen palabras resaltadas, como "documentos", en lugar de "PDF". ¿Por qué los resultados contienen las palabras destacadas que no estaban en la búsqueda?

Según la configuración predeterminada, Google Cloud Search, al igual que la Búsqueda web de Google, no solo busca las palabras exactas en una consulta. En cambio, Cloud Search expande la consulta para incluir sinónimos y raíces (incluso si no implementaste tus propios sinónimos). Esta expansión se realiza para recuperar documentos que coincidan ampliamente con la idea y la intención de la consulta. Después de seleccionar este amplio conjunto de documentos, los algoritmos de clasificación trabajan para garantizar que las mejores coincidencias se coloquen en la parte superior del conjunto de resultados.

Cuando el usuario buscó [los PDF de Joe], Cloud Search proporcionó las siguientes palabras como palabras aceptables adicionales:

  • Para [Joe], Cloud Search también podría coincidir con “joe” (una expansión de raíz) y “joes” (un sinónimo basado en la puntuación).
  • Para [PDF], Cloud Search también podría coincidir con “documentos” (una expansión de sinónimos) y “pdf” (una expansión de raíces).

De forma predeterminada, los sinónimos no son necesariamente bidireccionales. Por ejemplo, si un usuario busca el término "phishing", Cloud Search podría coincidir con "suplantación de identidad" como una expansión sinónimo. Sin embargo, si el usuario busca el término "suplantación de identidad" (phishing), es posible que Google no identifique el término "phishing" como una expansión.

Expansiones de palabras con guion frente a palabras sin guion

Cuando el usuario busca palabras con guiones en comparación con sus equivalentes sin guiones, como [camino] y [camino en el armario], Cloud Search trata estas consultas de manera diferente.

Además, se usan diferentes optimizaciones para las palabras con guiones y guiones bajos, como [walk-in] y [walk_in].

Compensar las expansiones predeterminadas

De forma predeterminada, no se garantiza ninguna expansión. Si deseas garantizar la bidireccionalidad de sinónimos o las expansiones de sinónimos específicos del dominio, crea tu propio conjunto de sinónimos específicos del dominio. Para obtener más información sobre la implementación de sinónimos, consulta Define sinónimos.

Interpretaciones predeterminadas

Cloud Search también proporciona interpretación en lenguaje natural, que interpreta los objetos, las propiedades y los valores de campo que se usan en una consulta de acuerdo con el esquema subido para una fuente de datos en particular. Si quieres obtener más información sobre esta interpretación de lenguaje natural, consulta Estructura tu esquema para optimizar la interpretación de consultas.

Cómo inhabilitar interpretaciones en lenguaje natural

Para inhabilitar las interpretaciones de lenguaje natural para una consulta específica, configura QueryInterpretationOptions.disableNlInterpretation como true en la solicitud de búsqueda.

Optimizaciones predeterminadas

Cloud Search también proporciona estas optimizaciones predeterminadas:

  • Combinación de los resultados proporcionados mediante corrección ortográfica. Por ejemplo, si la cadena de consulta fuera [beneficios corporativos], Cloud Search coincidiría con "corpoate" y con la ortografía correcta de "corporativo".

  • En el caso de las consultas que arrojarían pocos resultados o ninguno, Cloud Search usa un conjunto más permisivo de términos relacionados, más amplio que los sinónimos directos, cuando busca coincidencias. Para obtener más información, consulta Administra resultados complementarios.

Normaliza documentos y consultas

Normalizar se refiere a estandarizar ciertas palabras o frases antes o después de que se haya realizado una consulta. A fin de garantizar respuestas más coherentes para tus consultas, considera normalizar tus documentos (antes de la indexación o durante la indexación) y las consultas (después de que el usuario la haya realizado) de las siguientes maneras:

  • Para normalizar documentos, sigue estos pasos:

    1. Elige una ortografía canónica de las palabras críticas que se usan en los documentos de tus repositorios.
    2. Corrige la ortografía en los documentos del repositorio de código fuente o cuando se indexa el contenido para que coincida con la ortografía canónica.
  • Para normalizar las consultas, sigue estos pasos:

    1. Intercepta las consultas de los usuarios antes de enviarlas a Cloud Search.
    2. Vuelve a escribir las palabras en las consultas de los usuarios para que coincidan con la ortografía más común en la fuente de datos indexada.
    3. Envía la consulta a Cloud Search.

Inhabilitar las expansiones, las interpretaciones y las optimizaciones para todas las consultas

Si quieres inhabilitar las expansiones, las interpretaciones y las optimizaciones para una consulta específica, configura QueryInterpretationOptions.enableVerbatim Mode como true en la solicitud de búsqueda.