Suchqualität verbessern

Suchqualität bezieht sich auf die Qualität der Suchergebnisse in Bezug auf Ranking und Erinnerung aus der Sicht des Nutzers, der die Suchanfrage stellt.

Ranking bezieht sich auf die Reihenfolge der Elemente und Recall auf die Anzahl der abgerufenen relevanten Elemente. Ein Element (auch als Dokument bezeichnet) ist jeder digitale Inhalt, den Google Cloud Search indexieren kann. Zu den Elementtypen gehören Microsoft Office-Dokumente, PDF-Dateien, Zeilen in einer Datenbank, eindeutige URLs usw. Ein Artikel besteht aus:

  • Strukturierte Metadaten
  • Indexierbare Inhalte
  • ACLs

Cloud Search verwendet verschiedene Signale, um Suchanfrageergebnisse abzurufen und zu sortieren. Die Elemente, die sich aus einer Suchanfrage ergeben, werden als Suchanfrageergebnisse bezeichnet. Sie können die Signale von Cloud Search über Einstellungen im Schema, den Inhalt und die Metadaten des Elements (während der Indexierung) sowie die Suchanwendung beeinflussen. Ziel dieses Dokuments ist es, Ihnen zu helfen, die Suchqualität durch die Änderung dieser Signal-Influencer zu verbessern.

Eine Zusammenfassung der empfohlenen und optionalen Einstellungen finden Sie unter Zusammenfassung der empfohlenen und optionalen Einstellungen für die Suchqualität.

Aktualitätswert beeinflussen

Aktualität bezieht sich auf die Relevanz eines Suchergebnisses für die ursprünglichen Suchbegriffe. Die Aktualität eines Artikels wird anhand der folgenden Kriterien berechnet:

  • Die Wichtigkeit der einzelnen Suchbegriffe.
  • Die Anzahl der Treffer (die Häufigkeit, mit der ein Suchbegriff im Inhalt oder in den Metadaten des Elements vorkommt).
  • Der Typ der Übereinstimmungen, die der Suchbegriff und seine Varianten mit einem in Cloud Search indexierten Element haben.

Wenn Sie den Aktualitätswert einer Texteigenschaft beeinflussen möchten, definieren Sie RetrievalImportance für die Texteigenschaft in Ihrem Schema. Eine Übereinstimmung mit einer Unterkunft mit hohem RetrievalImportance führt zu einer höheren Punktzahl als eine Übereinstimmung mit einer Unterkunft mit niedrigem RetrievalImportance.

Angenommen, Sie haben eine Datenquelle mit den folgenden Merkmalen:

  • In der Datenquelle wird der Verlauf von Softwarefehlern gespeichert.
  • Jeder Fehler hat einen Namen, eine Beschreibung und eine Priorität.

Die meisten Nutzer würden diese Datenquelle mit dem Namen des Fehlers abfragen. Daher würden Sie RetrievalImportance für den Namen im Schema auf HIGHEST festlegen.

Umgekehrt werden die meisten Nutzer diese Datenquelle wahrscheinlich nicht mit der Beschreibung des Fehlers abfragen. Setzen Sie daher RetrievalImportance für die Beschreibung auf DEFAULT. Das folgende Beispielschema enthält RetrievalImportance-Einstellungen.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Bei HTML-Dokumenten werden Tags wie <title> und <h1> sowie Formatierungseinstellungen wie Schriftgröße und Fettdruck verwendet, um die Wichtigkeit verschiedener Begriffe zu bestimmen. Wenn die ContentFormat TEXT ist, hat ItemContent die Abruf-Wichtigkeit DEFAULT. Wenn es sich um HTML handelt, wird die Abruf-Wichtigkeit anhand von HTML-Eigenschaften bestimmt.

Aktualität von Einflussfaktoren

Die Aktualität gibt an, wie lange es her ist, dass ein Element geändert wurde. Sie wird durch die Attribute createTime und updateTime im ItemMetadata bestimmt. Ältere Elemente werden in den Suchergebnissen herabgestuft.

Sie können beeinflussen, wie die Aktualität für ein Objekt berechnet wird, indem Sie die freshnessProperty und freshnessDuration von FreshnessOptions im Schema anpassen.

Mit freshnessProperty können Sie anstelle des Standardwerts updateTime ein Datum oder Zeitstempelattribute verwenden, um die Aktualität zu berechnen.

In unserem vorherigen Beispiel für ein Software-Bug-Tracking-System könnte das Fälligkeitsdatum als freshnessProperty verwendet werden, sodass Elemente mit einem Fälligkeitsdatum, das dem aktuellen Datum am nächsten ist, als „aktueller“ betrachtet und im Ranking höher eingestuft werden. Das folgende Beispiel zeigt ein Schema mit freshnessProperty-Einstellungen:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Verwenden Sie freshnessDuration, um festzulegen, wann ein Element als veraltet gilt. Möglicherweise haben Sie eine Datenquelle, die nicht regelmäßig indexiert wird oder bei der die Aktualität keinen Einfluss auf das Ranking haben soll. Sie können dieses Ziel erreichen, indem Sie einen hohen Wert für freshnessDuration angeben.

Angenommen, Sie haben eine Datenquelle mit Profilinformationen zu Mitarbeitern. In diesem Szenario ist es möglicherweise sinnvoll, einen hohen freshnessDuration festzulegen, da Änderungen an Mitarbeiterinformationen oft nicht für das Ranking des Mitarbeiters relevant sind. Das folgende Beispiel zeigt ein Schema mit der Einstellung freshnessDuration:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

Sie können freshnessDuration auch auf einen sehr kleinen Wert für Datenquellen festlegen, deren Inhalt sich schnell ändert, z. B. für eine Datenquelle mit Nachrichtenartikeln. In diesem Fall sind die zuletzt erstellten oder geänderten Dokumente am relevantesten. Das folgende Beispiel zeigt ein Schema mit der Einstellung freshnessDuration für eine Datenquelle mit sich schnell ändernden Inhalten:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

Qualität der Einflussfaktoren

Qualität ist ein Maß für die Genauigkeit und Nützlichkeit eines Elements. Eine Datenquelle kann mehrere semantisch ähnliche Dokumente mit unterschiedlicher Qualität enthalten. Mit SearchQualityMetadata können Sie einen Qualitätswert zwischen 0 und 1 angeben. Elemente mit höheren Werten werden im Ranking im Vergleich zu Elementen mit niedrigeren Werten bevorzugt. Verwenden Sie diese Einstellung nur, wenn Sie die Qualität eines Elements außerhalb der für Cloud Search bereitgestellten Informationen beeinflussen oder steigern müssen.

Angenommen, Sie haben eine Datenquelle mit Dokumenten zu Mitarbeitervorteilen. Sie können SearchQualityMetadata verwenden, um das Ranking von Dokumenten, die von Mitarbeitern der Personalabteilung erstellt wurden, gegenüber Dokumenten, die von anderen Mitarbeitern erstellt wurden, zu verbessern.

Das folgende Beispiel zeigt ein Schema mit SearchQualityMetadata-Einstellungen für Probleme in einem Fehlertracking-System:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

Wenn ein Nutzer mit diesem Schema nach dem Suchbegriff „Problem“ sucht, wird Problem 3 im Schema (Qualität 1) höher eingestuft als Problem 2 (Qualität 0,5) und Problem 1 (wenn nichts angegeben ist, ist die Standardqualität 0).

Einfluss über Feldtyp

Mit Cloud Search können Sie das Ranking basierend auf dem Wert von Enum- oder Integer-Attributen beeinflussen. Für jede Ganzzahl- oder Enum-Property kann ein OrderedRanking angegeben werden. Diese Einstellung hat die folgenden Werte:

  • NO_ORDER (Standard): Die Eigenschaft hat keine Auswirkungen auf das Ranking.
  • ASCENDING: Elemente mit höheren Werten dieser Ganzzahl- oder Enum-Property werden im Ranking im Vergleich zu Elementen mit niedrigeren Werten bevorzugt.
  • DESCENDING: Elemente mit niedrigeren Werten der Ganzzahl- oder Enum-Property erhalten im Vergleich zu Elementen mit höheren Werten eine höhere Platzierung.

Angenommen, jeder Fehler in einem Fehlerbehebungssystem hat ein Enum-Attribut zum Speichern der Priorität des Fehlers als HIGH (1), MEDIUM (2) oder LOW (3). In diesem Szenario führt das Festlegen eines OrderedRanking von DESCENDING zu einer besseren Platzierung von Fehlern mit der Priorität HIGH im Vergleich zu Fehlern mit der Priorität LOW. Das folgende Beispielschema enthält OrderedRanking-Einstellungen für Probleme in einem Bug-Tracking-System:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

Ein Fehlerbehebungssystem könnte auch eine Ganzzahl-Property namens votes haben, um Feedback von Nutzern zur relativen Wichtigkeit eines Fehlers zu sammeln. Sie können die Property votes verwenden, um das Ranking zu beeinflussen, indem Sie den Fehlern mit den meisten Stimmen eine höhere Priorität zuweisen. In diesem Fall könnten Sie OrderedRanking als ASCENDING für die votes-Property angeben, damit Probleme mit den meisten Stimmen eine höhere Platzierung erhalten. Das folgende Beispiel zeigt ein Schema mit OrderedRanking-Einstellungen für Probleme in einem Bug-Tracking-System:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

Ranking durch Suchanfragenerweiterung beeinflussen

Suchanfragenerweiterung: Die Begriffe in der Suchanfrage werden mithilfe von Synonymen und Rechtschreibung erweitert, um bessere Ergebnisse zu erzielen.

Synonyme verwenden, um Suchergebnisse zu beeinflussen

In Cloud Search werden Synonyme verwendet, die aus öffentlichen Webinhalten abgeleitet werden, um die Suchbegriffe zu erweitern. Sie können auch benutzerdefinierte Synonyme definieren, um organisationsspezifische Terminologie zu erfassen, z. B. gängige Akronyme, die in einer Organisation verwendet werden, oder branchenspezifische Terminologie.

Benutzerdefinierte Synonyme können in einer Datenquelle oder als separate Datenquelle definiert werden. Standardmäßig gelten Synonyme für alle Datenquellen in allen Suchanwendungen. Sie können Synonyme jedoch nach Datenquelle und Suchanwendung gruppieren. Informationen zum Definieren benutzerdefinierter Synonyme, einschließlich der Gruppierung nach Suchanwendung, finden Sie unter Synonyme definieren.

Rechtschreibung zur Beeinflussung von Suchergebnissen verwenden

Cloud Search bietet Rechtschreibvorschläge basierend auf Modellen, die mit öffentlichen Google-Suchdaten erstellt wurden. Wenn Cloud Search eine Falschschreibung im Kontext einer Anfrage erkennt, wird die vorgeschlagene Anfrage in SpellResult zurückgegeben. Die vorgeschlagene Schreibweise kann dem Nutzer als Vorschlag angezeigt werden. Ein Nutzer gibt beispielsweise den Suchbegriff „employe“ falsch ein und erhält den Vorschlag „Meinten Sie employee?“.

Cloud Search verwendet auch Rechtschreibkorrekturen als Synonyme, um Dokumente abzurufen, die aufgrund eines Rechtschreibfehlers sonst möglicherweise nicht gefunden würden.

Ranking über Einstellungen der Suchanwendung beeinflussen

Wie in der Einführung in Google Cloud Search beschrieben, ist eine Suchanwendung eine Gruppe von Einstellungen, die, wenn sie mit einer Suchoberfläche verknüpft sind, kontextbezogene Informationen zu Suchen bereitstellen. Mit den folgenden Konfigurationen können Sie das Ranking über die Suchanwendung beeinflussen:

  • Konfiguration der Bewertung
  • Quellenkonfiguration

In den folgenden beiden Abschnitten wird erläutert, wie diese Konfigurationen das Ranking beeinflussen können.

Bewertungskonfiguration anpassen

Für jede Suchanwendung können Sie eine ScoringConfig angeben, mit der die Anwendung bestimmter Signale beim Ranking gesteuert wird. Derzeit können Sie Aktualität und Personalisierung deaktivieren.

Wenn die Aktualität deaktiviert ist, gilt das für alle Datenquellen, die in der Suchanwendung aufgeführt sind, unabhängig von den im Schema für die Datenquelle angegebenen Optionen für die Aktualität. Wenn die Personalisierung deaktiviert ist, haben die Eigentümer- und Interaktions-Steigerung ebenfalls keine Auswirkungen auf das Ranking.

Eine detaillierte Anleitung zum Konfigurieren dieser Einstellung finden Sie unter Suche in Cloud Search anpassen.

Quellkonfiguration anpassen

Mit der Quellkonfiguration können Sie Einstellungen auf Datenquellenebene in einer Suchanwendung festlegen. Die folgenden Einstellungen werden unterstützt:

  • Wichtigkeit der Quelle
  • Crowding

Wichtigkeit der Quelle festlegen

Quellenrelevanz bezieht sich auf die relative Bedeutung einer Datenquelle innerhalb einer Suchanwendung. Diese Einstellung kann im Feld SourceImportance innerhalb von SourceScoringConfig angegeben werden. Elemente aus einer Datenquelle mit der Quellwichtigkeit HIGH erhalten im Vergleich zu Elementen aus einer Datenquelle mit der Quellwichtigkeit DEFAULT oder LOW eine höhere Platzierung. Mit dieser Einstellung können Sie das Ranking beeinflussen, wenn Sie der Meinung sind, dass Nutzer Ergebnisse aus bestimmten Datenquellen bevorzugen.

Angenommen, Sie haben ein Produktsupportportal mit externen und internen Daten zur Fehlerbehebung. In diesem Fall sollten Sie Ihre Suchanwendung so konfigurieren, dass Ergebnisse aus der internen Datenquelle priorisiert werden.

Eine detaillierte Anleitung zum Konfigurieren dieser Einstellung finden Sie unter Suche in Cloud Search anpassen.

Crowding festlegen

Crowding bezieht sich auf die maximale Anzahl von Ergebnissen, die von einer Datenquelle in einer Suchanwendung zurückgegeben werden können. Dieser Wert kann über das Feld numResults in SourceCrowdingConfig gesteuert werden. Der Standardwert ist 3. Das bedeutet, dass Cloud Search Ergebnisse aus anderen Datenquellen anzeigt, wenn 3 Ergebnisse aus einer Datenquelle angezeigt wurden. Elemente aus der ersten Datenquelle werden nur dann berücksichtigt, wenn alle Datenquellen ihr Limit für die Überfüllung erreicht haben oder keine Ergebnisse aus anderen Datenquellen mehr vorhanden sind.

Diese Einstellung ist hilfreich, um die Vielfalt der Suchergebnisse zu gewährleisten und zu verhindern, dass eine Datenquelle die Suchergebnisseite dominiert.

Eine detaillierte Anleitung zum Konfigurieren dieser Einstellung finden Sie unter Suche in Cloud Search anpassen.

Ranking durch Personalisierung beeinflussen

Personalisierung bezieht sich auf die Darstellung personalisierter Suchergebnisse basierend auf dem jeweiligen Nutzer, der auf das Ergebnis zugreift. Sie können das Ranking beeinflussen, indem Sie Elemente anhand der folgenden Kriterien priorisieren:

  • Eigentum an Artikeln
  • Interaktion mit Artikel
  • Nutzerklicks
  • Sprache des Artikels

In den folgenden drei Abschnitten wird beschrieben, wie Sie die Suchqualität anhand dieser Kriterien beeinflussen können.

Ranking basierend auf dem Eigentum an Artikeln beeinflussen

Artikelbesitz bezieht sich auf die Verbesserung des Rankings von Artikeln, die dem Nutzer gehören, der die Suchanfrage ausführt. Jedes Element hat ein ItemAcl mit einem owners-Feld. Wenn der Nutzer, der eine Anfrage ausführt, der Inhaber eines Elements ist, wird dieses Element standardmäßig im Ranking höher eingestuft. Sie können die Personalisierung in der Suchanwendung deaktivieren.

Ranking basierend auf Artikelinteraktion verbessern

Elementinteraktion bezieht sich auf die Verbesserung des Rankings von Elementen, mit denen der Nutzer der Suchanfrage interagiert hat (z. B. angesehen, kommentiert oder bearbeitet).

Signale für die Interaktion mit Elementen werden automatisch für Google Workspace-Produkte wie Drive und Gmail abgerufen. Für andere Produkte können Sie Interaktionsdaten auf Artikelebene angeben, einschließlich des Interaktionstyps (Ansehen, Bearbeiten), des Zeitstempels der Interaktion und des Prinzipal (Nutzer, der mit dem Artikel interagiert hat). Artikel mit kürzlich erfolgten Interaktionen erhalten einen höheren Ranking-Boost.

Ranking basierend auf Nutzerklicks verbessern

Cloud Search erfasst die Klicks auf aktuelle Suchergebnisse und verwendet sie, um das Ranking für zukünftige Suchanfragen zu verbessern. Dazu werden Elemente, die zuvor vom selben Nutzer angeklickt wurden, höher eingestuft.

Ranking durch die Interpretation von Suchanfragen beeinflussen

Die Funktion Suchanfrage interpretieren in Cloud Search interpretiert automatisch die Operatoren und Filter in der Suchanfrage eines Nutzers und wandelt diese Elemente in eine strukturierte, operatorbasierte Suchanfrage um. Bei der Interpretation von Anfragen werden Operatoren verwendet, die im Schema definiert sind, sowie die indexierten Dokumente, um die Bedeutung der Nutzeranfrage zu ermitteln. Mit dieser Funktion können Nutzer mit minimalen Keywords suchen und trotzdem präzise Ergebnisse erhalten. Weitere Informationen finden Sie unter Schema für optimale Abfrageinterpretation strukturieren.

Ranking basierend auf der Sprache des Artikels erhöhen

Sprache bezieht sich auf die Herabstufung von Elementen, deren Sprache nicht mit der Sprache der Anfrage übereinstimmt. Die folgenden Faktoren wirken sich auf das Ranking von Elementen nach Sprache aus:

  • Die Sprache der Abfrage. Die automatisch erkannte Sprache der Suchanfrage oder die languageCode, die in der RequestOptions angegeben ist.

    Wenn Sie eine benutzerdefinierte Suchoberfläche erstellen, sollten Sie languageCode auf die Sprache der Benutzeroberfläche oder die Spracheinstellung des Nutzers festlegen, z. B. die Sprache des Webbrowsers oder der Seite der Suchoberfläche. Die automatisch erkannte Sprache der Anfrage hat Vorrang vor languageCode, damit die Suchqualität nicht beeinträchtigt wird, wenn ein Nutzer eine Anfrage in einer Sprache eingibt, die sich von seiner Benutzeroberfläche unterscheidet.

  • Die Sprache des Artikels. Die in ItemMetadata zum Zeitpunkt der Indexierung festgelegte contentLanguage oder die von Cloud Search automatisch erkannte Inhaltssprache.

    Wenn das contentLanguage eines Dokuments bei der Indexierung leer gelassen wird und das ItemContent ausgefüllt ist, versucht Cloud Search, die im ItemContent verwendete Sprache zu erkennen und intern zu speichern. Die automatisch erkannte Sprache wird dem Feld contentLanguage nicht hinzugefügt.

Wenn die Sprache der Anfrage und des Artikels übereinstimmen, wird keine Sprachherabstufung angewendet. Wenn diese Einstellungen nicht übereinstimmen, wird der Artikel herabgestuft. Die Herabstufung der Sprache wird nicht auf Dokumente angewendet, in denen contentLanguage leer ist und die Sprache nicht automatisch von Cloud Search erkannt werden konnte. Die Einstufung eines Dokuments wird also nicht beeinträchtigt, wenn Cloud Search die Sprache nicht erkennen kann.

Ranking basierend auf dem Artikelkontext erhöhen

Sie können das Ranking von Artikeln erhöhen, die für den Kontext einer Suchanfrage relevanter sind. Der Kontext (contextAttributes) ist eine Reihe benannter Attribute, die Sie beim Indexieren und in der Suchanfrage angeben können, um Kontext für eine bestimmte Suchanfrage bereitzustellen.

Angenommen, ein Element wie ein Dokument zu Mitarbeiterleistungen ist im Kontext von Location und Department relevanter, z. B. einer Stadt (San Francisco), einem Bundesstaat (California), einem Land (USA) und einem Department (Engineering). In diesem Fall können Sie das Element mit den folgenden benannten Attributen indexieren:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

Wenn der Nutzer in die Suchoberfläche die Suchanfrage „Vorteile“ eingibt, können Sie die Standortinformationen und die Abteilung des Nutzers in die Suchanfrage aufnehmen. Hier ist ein Beispiel für eine Suchanfrage mit Standort- und Abteilungsinformationen für einen Engineer in Chicago:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Da sowohl das indexierte Element als auch die Suchanfrage die Attribute „Department=Engineering“ und „Location=USA“ enthalten, wird das indexierte Element (ein Dokument zu Mitarbeiterleistungen) weiter oben in den Suchergebnissen angezeigt.

Angenommen, ein anderer Nutzer, ein Ingenieur in Indien, gibt in die Suchoberfläche die Suchanfrage „benefits“ ein. Hier ist eine Suchanfrage mit Informationen zum Standort und zur Abteilung:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Da sowohl das indexierte Element als auch die Suchanfrage nur das Attribut „Department=Engineering“ enthalten, wird das indexierte Element in den Suchergebnissen nur geringfügig höher angezeigt als bei der ersten Suchanfrage „benefits“ eines Ingenieurs in Chicago, Illinois, USA.

Im Folgenden finden Sie einige Beispielkontexte, die Sie verwenden können, um das Ranking zu verbessern:

  • Standort: Elemente können für Nutzer an einem bestimmten Standort relevanter sein, z. B. in einem Gebäude, einer Stadt, einem Land oder einer Region.
  • Jobrolle: Elemente können für Nutzer in einer bestimmten Jobrolle, z. B. „Technischer Autor“ oder „Ingenieur“, relevanter sein.
  • Abteilung: Elemente können für bestimmte Abteilungen wie Vertrieb oder Marketing relevanter sein.
  • Berufsebene: Elemente können für bestimmte Berufsebenen wie Director oder CEO relevanter sein.
  • Mitarbeitertyp: Elemente können für bestimmte Mitarbeitertypen relevanter sein, z. B. für Teilzeit- und Vollzeitbeschäftigte.
  • Betriebszugehörigkeit: Elemente können für die Betriebszugehörigkeit eines Mitarbeiters relevanter sein, z. B. für einen neuen Mitarbeiter.

Ranking durch Artikelbeliebtheit beeinflussen

Cloud Search stuft beliebte Elemente im Ranking höher ein, d. h. Elemente, die bei den letzten Suchanfragen Klicks erhalten haben.

Ranking durch Clickboost beeinflussen

Cloud Search erfasst die Klicks auf aktuelle Suchergebnisse und verwendet sie, um das Ranking für zukünftige Suchanfragen zu verbessern. Dazu werden beliebte Elemente für eine bestimmte Suchanfrage hervorgehoben.

Zusammenfassung der empfohlenen und optionalen Einstellungen für die Suchqualität

In der folgenden Tabelle sind alle empfohlenen und optionalen Einstellungen für die Suchqualität aufgeführt. Mit diesen Empfehlungen können Sie die Ranking-Modelle von Cloud Search optimal nutzen.

EinstellungStandortEmpfohlen/optionalDetails
Schemaeinstellungen
Feld ItemContentItemContentEmpfohlenWenn Sie Ihr Schema erstellen oder aktualisieren, füllen Sie die unstrukturierten Inhalte eines Elements aus. Dieses Feld wird zum Generieren von Snippets verwendet.
Feld RetrievalImportanceRetrievalImportanceEmpfohlenLegen Sie beim Erstellen oder Aktualisieren eines Schemas für Texteigenschaften fest, welche eindeutig wichtig oder relevant sind.
FreshnessOptionsFreshnessOptionsOptionalWenn Sie ein Schema erstellen oder aktualisieren, sollten Sie dafür sorgen, dass Artikel nicht aufgrund falscher oder fehlender Daten herabgestuft werden.
Indexierungseinstellungen
createTime/updateTimeItemMetadataEmpfohlenWird während der Indexierung eines Elements ausgefüllt.
contentLanguageItemMetadataEmpfohlenWird während der Indexierung eines Elements ausgefüllt. Wenn sie nicht vorhanden ist, versucht Cloud Search, die in ItemContent verwendete Sprache zu erkennen.
Feld ownersItemAcl()EmpfohlenWird während der Indexierung eines Elements ausgefüllt.
Benutzerdefinierte Synonyme_dictionaryEntry-SchemaEmpfohlenAuf Datenquellenebene oder als separate Datenquelle bei der Indexierung definieren.
Feld qualitySearchQualityMetadataOptionalUm die Basisqualität im Vergleich zu anderen semantisch ähnlichen Elementen zu steigern, legen Sie die Qualität beim Indexieren fest. Wenn Sie dieses Feld für alle Elemente in einer Datenquelle festlegen, wird seine Wirkung aufgehoben.
Interaktionsdaten auf ArtikelebeneinteractionOptionalWenn die Datenquelle Nutzerinteraktionen aufzeichnet und Zugriff darauf bietet, füllen Sie die Interaktionen für jedes Element während der Indexierung aus.
Ganzzahl-/Enum-AttributeOrderedRankingOptionalWenn die Reihenfolge der Elemente relevant ist, geben Sie beim Indexieren das geordnete Ranking für Ganzzahl- und Enum-Properties an.
In den Anwendungseinstellungen suchen
Personalization=falseScoringConfig oder über die Cloud Search-Admin-BenutzeroberflächeEmpfohlenBeim Erstellen oder Aktualisieren der Suchanwendung. Achten Sie darauf, die richtigen Inhaberinformationen anzugeben, wie unter „Ranking durch Personalisierung beeinflussen“ beschrieben.
Feld SourceImportanceSourceCrowdingConfigOptionalLegen Sie dieses Feld fest, um die Ergebnisse aus bestimmten Datenquellen zu beeinflussen.
Feld numResultsSourceCrowdingConfigOptionalLegen Sie dieses Feld fest, um die Vielfalt der Ergebnisse zu steuern.

Nächste Schritte

Als Nächstes könnten Sie Folgendes tun:

  1. Schema für optimale Abfrageinterpretation strukturieren

  2. Informieren Sie sich, wie Sie das Schema _dictionaryEntry nutzen können, um Synonyme für Begriffe zu bestimmen, die in Ihrem Unternehmen häufig verwendet werden. Informationen zur Verwendung des Schemas _dictionaryEntry finden Sie unter Synonyme definieren.