Google Cloud Search ma kilka domyślnych rozszerzeń, interpretacji i optymalizacji, które wpływają na wyniki wyszukiwania. Jeśli wyniki wyszukiwania są nieoczekiwane, przed skontaktowaniem się z zespołem pomocy Cloud Search zapoznaj się z tym przewodnikiem.
Domyślne rozwinięcia
Załóżmy, że użytkownik wyszukuje za pomocą ciągu znaków, np. [PDF-y Janka], ale niektóre zwrócone wyniki zawierają wyróżnione słowa, np. „dokumenty”, zamiast „PDF-y”. Dlaczego wyniki zawierają podświetlone słowa, których nie było w zapytaniu?
Domyślnie Google Cloud Search, podobnie jak wyszukiwarka Google, nie wyszukuje tylko dokładnych słów w zapytaniu. Zamiast tego Cloud Search rozszerza zapytanie, aby uwzględnić synonimy i rdzenie słów (nawet jeśli nie masz własnych synonimów). Rozszerzenie to ma na celu pobranie dokumentów, które w dużym stopniu odpowiadają idei i intencji zapytania. Po wybraniu tego szerokiego zestawu dokumentów algorytmy rankingowe dbają o to, aby najlepsze dopasowania znajdowały się na początku zestawu wyników.
Gdy użytkownik wyszukał [PDF-y Joe], Cloud Search podał te dodatkowe akceptowane słowa:
- W przypadku zapytania [Joe’s] Cloud Search może też dopasować słowa „joe” (rozszerzenie o rdzeń) i „joes” (synonim na podstawie interpunkcji).
- W przypadku [plików PDF] Cloud Search może też dopasować słowa „dokumenty” (rozszerzenie synonimów) i „pdf” (rozszerzenie rdzenia).
Domyślnie synonimy nie muszą być dwukierunkowe. Jeśli na przykład użytkownik wyszuka termin „phishing”, Cloud Search może dopasować „phish” jako synonim. Jeśli jednak użytkownik wyszuka termin „phish”, Google może nie dopasować go do słowa „phishing” jako rozszerzenia.
Rozszerzenia dla słów z łącznikiem i bez niego
Gdy użytkownik wyszukuje słowa z łącznikiem i bez łącznika, np. [walk-in closet] i [walk in closet], Cloud Search traktuje te zapytania inaczej.
Poza tym w przypadku słów z łącznikiem i podkreśleniem, np. [walk-in] i [walk_in], stosowane są różne optymalizacje.
Kompensowanie domyślnych rozszerzeń
Domyślnie nie ma gwarancji żadnego rozszerzenia. Jeśli chcesz zapewnić dwukierunkowość synonimów lub rozszerzeń synonimów specyficznych dla domeny, utwórz własny zestaw synonimów specyficznych dla domeny. Więcej informacji o wdrażaniu synonimów znajdziesz w artykule Definiowanie synonimów.
Domyślne interpretacje
Cloud Search zapewnia też interpretację w języku naturalnym, która interpretuje obiekty, właściwości i wartości pól użyte w zapytaniu zgodnie ze schematem przesłanym dla danego źródła danych. Więcej informacji o interpretacji w języku naturalnym znajdziesz w artykule Strukturyzowanie schematu pod kątem optymalnej interpretacji zapytań.
Wyłączanie interpretacji w języku naturalnym
Aby wyłączyć interpretacje w języku naturalnym w przypadku konkretnego zapytania, w żądaniu wyszukiwania ustaw wartość
QueryInterpretationOptions.disableNlInterpretation
na true.
Optymalizacje domyślne
Cloud Search zapewnia też te domyślne optymalizacje:
łączenie wyników z wynikami korekty pisowni; Jeśli np. ciąg zapytania to [corpoate benefits], Cloud Search dopasuje słowo „corpoate” do prawidłowej pisowni słowa „corporate”.
W przypadku zapytań, które dałyby 0 wyników lub niewiele wyników, Cloud Search używa bardziej liberalnego zestawu powiązanych terminów, szerszego niż bezpośrednie synonimy, podczas dopasowywania wyników. Więcej informacji znajdziesz w artykule Obsługa wyników dodatkowych.
Normalizowanie dokumentów i zapytań
Normalizacja to ujednolicanie określonych słów lub wyrażeń przed wysłaniem zapytania lub po jego wysłaniu. Aby uzyskać bardziej spójne odpowiedzi na zapytania, rozważ normalizację dokumentów (przed indeksowaniem lub w jego trakcie) i zapytań (po wysłaniu zapytania przez użytkownika) w ten sposób:
Aby znormalizować dokumenty:
- Wybierz kanoniczną pisownię najważniejszych słów używanych w dokumentach w repozytoriach.
- Popraw pisownię w dokumentach repozytorium źródłowego lub podczas indeksowania treści, aby była zgodna z pisownią kanoniczną.
Aby znormalizować zapytania:
- Przechwytywanie zapytań użytkowników przed wysłaniem ich do Cloud Search.
- Przepisywanie słów w zapytaniach użytkowników, aby dopasować je do najczęstszej pisowni w indeksowanym źródle danych.
- Wyślij zapytanie do Cloud Search.
Wyłączanie rozszerzeń, interpretacji i optymalizacji w przypadku wszystkich zapytań
Aby wyłączyć rozszerzenia, interpretacje i optymalizacje dla konkretnego zapytania, ustaw wartość QueryInterpretationOptions.enableVerbatim Mode na true w żądaniu wyszukiwania.