Google Cloud Search tiene varias expansiones, interpretaciones y optimizaciones predeterminadas que afectan los resultados de la búsqueda. Si alguna vez ves resultados inesperados en las búsquedas, consulta esta guía antes de comunicarte con el equipo de asistencia de Cloud Search.
Expansiones predeterminadas
Supongamos que un usuario realiza una búsqueda con una cadena, como [PDFs de Juan], pero algunos de los resultados devueltos contienen palabras destacadas, como "documentos", en lugar de "PDFs". ¿Por qué los resultados contienen las palabras destacadas que no estaban en la búsqueda?
De forma predeterminada, Google Cloud Search, al igual que la Búsqueda web de Google, no solo busca las palabras exactas de una consulta. En cambio, Cloud Search expande la búsqueda para incluir sinónimos y raíces de palabras (incluso si no implementaste tus propios sinónimos). Esta expansión se realiza para recuperar documentos que coincidan de forma general con la idea y la intención de la búsqueda. Después de seleccionar este amplio conjunto de documentos, los algoritmos de clasificación se encargan de garantizar que las mejores coincidencias se coloquen en la parte superior del conjunto de resultados.
Cuando el usuario buscó [PDFs de Juan], Cloud Search proporcionó las siguientes palabras adicionales aceptables:
- En el caso de [Joe’s], Cloud Search también podría hacer coincidir "joe" (una expansión de raíz) y "joes" (un sinónimo basado en la puntuación).
- En el caso de los [archivos PDF], Cloud Search también podría hacer coincidir "documentos" (expansión de sinónimos) y "pdf" (expansión de raíz).
De forma predeterminada, los sinónimos no son necesariamente bidireccionales. Por ejemplo, si un usuario busca el término "phishing", Cloud Search podría hacer coincidir "phish" como una expansión de sinónimos. Sin embargo, si el usuario busca el término "phish", es posible que Google no lo haga coincidir con "phishing" como expansión.
Expansiones para palabras con guion y sin guion
Cuando el usuario busca palabras con guion en lugar de sus equivalentes sin guion, como [armario con vestidor] y [armario vestidor], Cloud Search trata estas búsquedas de manera diferente.
Además, se usan diferentes optimizaciones para las palabras con guion y con guion bajo, como [sin-cita] y [sin_cita].
Compensa las expansiones predeterminadas
De forma predeterminada, no se garantiza ninguna expansión. Si deseas garantizar la bidireccionalidad de los sinónimos o las expansiones de sinónimos específicos del dominio, crea tu propio conjunto de sinónimos específicos del dominio. Para obtener más información sobre la implementación de sinónimos, consulta Define sinónimos.
Interpretaciones predeterminadas
Cloud Search también proporciona interpretación en lenguaje natural, que interpreta los objetos, las propiedades y los valores de los campos que se usan en una búsqueda según el esquema que se subió para una fuente de datos en particular. Si quieres obtener más información sobre esta interpretación en lenguaje natural, consulta Diseña la estructura de tu esquema para optimizar la interpretación de búsquedas.
Inhabilita las interpretaciones en lenguaje natural
Para inhabilitar las interpretaciones en lenguaje natural para una búsqueda específica, establece QueryInterpretationOptions.disableNlInterpretation
en true
en la solicitud de búsqueda.
Optimizaciones predeterminadas
Cloud Search también proporciona estas optimizaciones predeterminadas:
Combinación de los resultados proporcionados por la corrección ortográfica. Por ejemplo, si la cadena de búsqueda fuera [corpoate benefits], Cloud Search coincidiría con "corpoate" y la ortografía correcta de "corporate".
En el caso de las búsquedas que arrojarían pocos o ningún resultado, Cloud Search usa un conjunto más permisivo de términos relacionados, más amplio que los sinónimos directos, cuando se correlacionan los resultados. Para obtener más información, consulta Cómo controlar los resultados complementarios.
Normalización de documentos y búsquedas
La normalización se refiere a la estandarización de ciertas palabras o frases antes o después de que se realice una búsqueda. Para garantizar respuestas más coherentes a tus búsquedas, considera normalizar tus documentos (antes o durante la indexación) y tus búsquedas (después de que el usuario las realice) de las siguientes maneras:
Para normalizar documentos, sigue estos pasos:
- Elige una ortografía canónica para las palabras importantes que se usan en los documentos de tus repositorios.
- Corregir la ortografía en los documentos del repositorio fuente o cuando se indexa contenido para que coincida con la ortografía canónica
Para normalizar las búsquedas, haz lo siguiente:
- Intercepta las búsquedas de los usuarios antes de enviarlas a Cloud Search.
- Reescribir palabras en las búsquedas de los usuarios para que coincidan con la ortografía más común en la fuente de datos indexada
- Envía la búsqueda a Cloud Search.
Inhabilita las expansiones, las interpretaciones y las optimizaciones para todas las búsquedas
Para inhabilitar las expansiones, las interpretaciones y las optimizaciones de una búsqueda específica, establece QueryInterpretationOptions.enableVerbatim Mode
en true
en la solicitud de búsqueda.