Migliorare la qualità della ricerca

Qualità della ricerca si riferisce alla qualità dei risultati di ricerca in termini di ranking e richiamo percepiti dall'utente.

Il ranking è l'ordine degli elementi, mentre il richiamo è il numero di elementi pertinenti recuperati. Un elemento (o documento) è qualsiasi contenuto digitale indicizzabile da Google Cloud Search, ad esempio documenti di Microsoft Office, file PDF, righe di database o URL univoci. Un elemento è composto da:

  • Metadati strutturati
  • Contenuti indicizzabili
  • ACL

Cloud Search utilizza vari indicatori per recuperare e classificare i risultati. Puoi influenzare questi indicatori tramite le impostazioni dello schema, i contenuti e i metadati degli elementi e l'applicazione di ricerca. Questo documento ti aiuta a migliorare la qualità della ricerca modificando questi indicatori.

Per un riepilogo delle impostazioni, consulta il riepilogo delle impostazioni di qualità della ricerca.

Influenzare il punteggio di topicalità

La topicalità è la pertinenza di un risultato di ricerca rispetto ai termini della query. Cloud Search calcola la topicalità in base a:

  • L'importanza di ogni termine della query.
  • Il numero di corrispondenze (la frequenza con cui un termine della query viene visualizzato nei contenuti o nei metadati).
  • I tipi di corrispondenza tra i termini della query e gli elementi indicizzati.

Per influenzare il punteggio di topicalità di una proprietà di testo, definisci il RetrievalImportance nello schema. Una corrispondenza su una proprietà con RetrievalImportance elevata genera un punteggio più alto.

Ad esempio, se memorizzi la cronologia dei bug software, è probabile che gli utenti eseguano query in base al nome del bug. Imposta RetrievalImportance per il nome su HIGHEST. Per le descrizioni, utilizza DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

Per i documenti HTML, tag come <title> e <h1> aiutano a determinare l'importanza dei termini. Se ContentFormat è TEXT, ItemContent utilizza l'importanza DEFAULT. Se è HTML, l'importanza dipende dalle proprietà HTML.

Influenzare l'aggiornamento

L'aggiornamento misura la data di modifica più recente di un elemento, utilizzando createTime e updateTime in ItemMetadata. Gli elementi meno recenti hanno un ranking inferiore.

Puoi influenzare l'aggiornamento modificando freshnessProperty e freshnessDuration in FreshnessOptions. freshnessProperty ti consente di utilizzare una data o un timestamp personalizzati anziché updateTime. Per i bug, puoi utilizzare una data di scadenza in modo che gli elementi con le date più vicine a quella attuale abbiano un ranking più alto.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Utilizza freshnessDuration per specificare quando un elemento viene considerato obsoleto. Un valore elevato, ad esempio 100 anni, annulla l'effetto di aggiornamento. Questa opzione è utile per i dati statici come i profili dei dipendenti. Per le notizie, utilizza un valore piccolo, ad esempio tre giorni.

Influenzare la qualità

La qualità misura l'accuratezza e l'utilità di un elemento. Specifica un valore compreso tra 0 e 1 utilizzando SearchQualityMetadata. Valori più alti migliorano il ranking. Ad esempio, puoi migliorare i documenti sui vantaggi creati dalle risorse umane.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Influenzare utilizzando il tipo di campo

Puoi influenzare il ranking in base alle proprietà enum o integer utilizzando OrderedRanking:

  • NO_ORDER (valore predefinito): nessun effetto sul ranking.
  • ASCENDING: valori più alti migliorano il ranking.
  • DESCENDING: valori più bassi migliorano il ranking.

Per la priorità dei bug, utilizza DESCENDING se HIGH è 1 e LOW è 3. Per una proprietà votes, utilizza ASCENDING.

Influenzare il ranking tramite l'espansione della query

L'espansione della query utilizza sinonimi e ortografia per migliorare i risultati.

Utilizzare i sinonimi

Cloud Search utilizza i contenuti web pubblici per i sinonimi. Puoi anche definire sinonimi personalizzati per la terminologia specifica dell'organizzazione. Consulta Definire i sinonimi.

Utilizzare l'ortografia

Cloud Search fornisce suggerimenti ortografici in SpellResult. Utilizza anche le correzioni ortografiche come sinonimi per trovare i documenti.

Influenzare il ranking tramite le impostazioni dell'applicazione di ricerca

Un'applicazione di ricerca fornisce informazioni contestuali. Puoi influenzare il ranking utilizzando le seguenti impostazioni.

Modificare la configurazione del punteggio

Specifica un ScoringConfig per disattivare l'aggiornamento o la personalizzazione. La disattivazione della personalizzazione rimuove i miglioramenti del proprietario e dell'interazione. Consulta Personalizzare l'esperienza di ricerca.

Modificare la configurazione dell'origine

Specifica le impostazioni a livello di origine dati:

  • Importanza dell'origine: gli elementi di un'origine con importanza HIGH hanno un ranking più alto.
  • Crowding: Limita i risultati di una singola origine (il valore predefinito è 3) per garantire la diversità.

Personalizzazione

La personalizzazione assegna la priorità ai risultati in base all'utente:

  • Proprietà dell'elemento: migliora gli elementi di proprietà dell'utente.
  • Interazione con l'elemento: migliora gli elementi che l'utente ha visualizzato, modificato o commentato di recente.
  • Clic dell'utente: migliora gli elementi su cui l'utente ha fatto clic in precedenza. Non modificare l'URL del risultato, perché viene utilizzato per raccogliere questi dati.

Interpretazione della query

La funzionalità di interpretazione della query converte le query degli utenti in query strutturate basate su operatori utilizzando le definizioni dello schema. In questo modo si ottengono risultati precisi anche con un numero minimo di parole chiave. Consulta Strutturare uno schema per un'interpretazione ottimale delle query.

Lingua dell'elemento

Cloud Search declassa gli elementi la cui lingua non corrisponde alla lingua della query. Imposta languageCode in RequestOptions sulla preferenza dell'utente.

Contesto dell'elemento

Utilizza contextAttributes per aumentare il ranking degli elementi pertinenti al contesto della query, ad esempio la località o il reparto.

Popolarità dell'elemento

Cloud Search migliora gli elementi su cui gli utenti fanno clic di frequente nelle query recenti. Non modificare gli URL dei risultati di ricerca, perché vengono utilizzati per monitorare questi clic.

Riepilogo delle impostazioni di qualità della ricerca

Le tabelle seguenti forniscono un riepilogo delle impostazioni di qualità della ricerca:

Impostazioni dello schema

Impostazione Posizione Suggerimento Dettagli
ItemContent ItemContent Consigliato Topicalità
RetrievalImportance RetrievalImportance Consigliato Topicalità
FreshnessOptions FreshnessOptions Facoltativo Aggiornamento

Impostazioni di indicizzazione

Impostazione Posizione Suggerimento Dettagli
createTime/updateTime ItemMetadata Consigliato Aggiornamento
contentLanguage ItemMetadata Consigliato Lingua dell'elemento
owners ItemAcl Consigliato Proprietà dell'elemento
Sinonimi personalizzati _dictionaryEntry Consigliato Utilizzare i sinonimi
quality SearchQualityMetadata Facoltativo Influenzare la qualità
Dati sull'interazione interaction Facoltativo Interazione con l'elemento
OrderedRanking OrderedRanking Facoltativo Tipo di campo

Impostazioni dell'applicazione di ricerca

Impostazione Posizione Suggerimento Dettagli
Disattivare la personalizzazione ScoringConfig Consigliato Personalizzazione
Importanza dell'origine SourceCrowdingConfig Facoltativo Configurazione dell'origine
Crowding SourceCrowdingConfig Facoltativo Configurazione dell'origine

Passaggi successivi

  1. Strutturare uno schema per un'interpretazione ottimale delle query.
  2. Definire i sinonimi.