Compenser les expansions, les interprétations et les optimisations par défaut

Google Cloud Search propose plusieurs expansions, interprétations et optimisations par défaut qui affectent les résultats de recherche. Si vous obtenez des résultats inattendus pour vos requêtes de recherche, consultez ce guide avant de contacter l'assistance Cloud Search.

Développements par défaut

Supposons qu'un utilisateur effectue une recherche à l'aide d'une chaîne de caractères, telle que [PDF de Joe], mais que certains résultats renvoyés contiennent des mots mis en surbrillance, tels que "documents", au lieu de "PDF". Pourquoi les résultats contiennent-ils des mots mis en surbrillance qui ne figuraient pas dans la requête de recherche ?

Par défaut, Google Cloud Search, tout comme la recherche sur le Web Google, ne recherche pas uniquement les mots exacts d'une requête. Cloud Search développe plutôt la requête pour inclure les synonymes et les racines des mots (même si vous n'avez pas implémenté vos propres synonymes). Cette expansion est effectuée pour récupérer des documents qui correspondent globalement à l'idée et à l'intention de la requête. Une fois cet ensemble de documents généraux sélectionnés, les algorithmes de classement s'efforcent de placer les meilleurs résultats en haut de l'ensemble de résultats.

Lorsque l'utilisateur a recherché [PDF de Joe], Cloud Search a fourni les mots acceptables supplémentaires suivants :

  • Pour [Joe's], Cloud Search peut également trouver "joe" (une expansion de radical) et "joes" (un synonyme basé sur la ponctuation).
  • Pour les [PDF], Cloud Search peut également correspondre à "documents" (expansion de synonymes) et "pdf" (expansion de radicaux).

Par défaut, les synonymes ne sont pas nécessairement bidirectionnels. Par exemple, si un utilisateur recherche le terme "hameçonnage", Cloud Search peut faire correspondre "hameçonner" comme synonyme. Toutefois, si l'utilisateur recherche le terme "hameçon", il est possible que Google ne fasse pas correspondre "hameçonnage" en tant qu'expansion.

Développement des mots avec ou sans trait d'union

Lorsque l'utilisateur recherche des mots composés avec un trait d'union par rapport à leurs équivalents sans trait d'union, comme [walk-in closet] et [walk in closet], Cloud Search traite ces requêtes différemment.

De plus, différentes optimisations sont utilisées pour les mots avec trait d'union et avec underscore, tels que [walk-in] et [walk_in].

Compenser les expansions par défaut

Aucune expansion n'est garantie par défaut. Si vous souhaitez assurer la bidirectionnalité des synonymes ou des expansions de synonymes spécifiques à un domaine, créez votre propre ensemble de synonymes spécifiques à un domaine. Pour en savoir plus sur l'implémentation de synonymes, consultez Définir des synonymes.

Interprétations par défaut

Cloud Search fournit également une interprétation en langage naturel qui interprète les objets, les propriétés et les valeurs de champ utilisés dans une requête en fonction du schéma importé pour une source de données spécifique. Pour en savoir plus sur cette interprétation en langage naturel, consultez Structurer votre schéma pour une interprétation optimale des requêtes.

Désactiver les interprétations en langage naturel

Pour désactiver les interprétations en langage naturel pour une requête spécifique, définissez QueryInterpretationOptions.disableNlInterpretation sur true dans la demande de recherche.

Optimisations par défaut

Cloud Search fournit également les optimisations par défaut suivantes :

  • Fusion des résultats fournis par la correction orthographique. Par exemple, si la chaîne de requête est [avantages sociaux], Cloud Search fera correspondre "avantages" et l'orthographe correcte de "sociaux".

  • Pour les requêtes qui ne généreraient aucun résultat ou très peu, Cloud Search utilise un ensemble de termes associés plus permissif, plus large que les synonymes directs, lors de la mise en correspondance des résultats. Pour en savoir plus, consultez Gérer les résultats supplémentaires.

Normaliser les documents et les requêtes

La normalisation consiste à standardiser certains mots ou expressions avant ou après une requête. Pour obtenir des réponses plus cohérentes à vos requêtes, envisagez de normaliser vos documents (avant ou pendant l'indexation) et vos requêtes (après que l'utilisateur a effectué la requête) de la manière suivante :

  • Pour normaliser des documents :

    1. Choisissez une orthographe canonique pour les mots clés utilisés dans les documents de vos dépôts.
    2. Corrigez l'orthographe dans les documents du dépôt source ou lors de l'indexation du contenu pour qu'elle corresponde à l'orthographe canonique.
  • Pour normaliser les requêtes :

    1. Interceptez les requêtes utilisateur avant de les envoyer à Cloud Search.
    2. Réécrivez les mots des requêtes utilisateur pour qu'ils correspondent à l'orthographe la plus courante dans la source de données indexée.
    3. Envoyez la requête à Cloud Search.

Désactiver les expansions, les interprétations et les optimisations pour toutes les requêtes

Pour désactiver les expansions, les interprétations et les optimisations pour une requête spécifique, définissez QueryInterpretationOptions.enableVerbatim Mode sur true dans la requête de recherche.