Google Cloud Search には、検索結果に影響するデフォルトの拡張、解釈、最適化がいくつかあります。予期しない検索結果が表示された場合は、Cloud Search サポートにお問い合わせいただく前に、このガイドをご覧ください。
このドキュメントでは、ユーザー クエリは角かっこ([query] など)で囲まれ、システムによる解釈は引用符("interpretation" など)で囲まれています。
このドキュメントのクエリ結果は動作の例であり、拡張、解釈、最適化の仕組みを理解するのに役立ちます。実際の結果は異なる場合があります。
デフォルトの展開
ユーザーが [Joe’s PDFs] を検索したときに、"PDFs" ではなく "documents" などのハイライト表示された単語が一部の検索結果に含まれているとします。これは、Cloud Search が Google 検索と同様に、類義語や語幹を含むようにクエリを拡張するためです。この拡張により、クエリのアイデアや意図に一致するドキュメントを検索できます。ランキング アルゴリズムは、最適な一致が上部に表示されるようにします。
ユーザーが [Joe’s PDFs] を検索すると、Cloud Search は次のような追加の単語を提示することがあります。
[Joe’s]の場合、"joe"(語幹の拡張)と"joes"(句読点に基づく同義語)が一致する可能性があります。[PDFs]の場合、"documents"(同義語の拡張)と"pdf"(語幹の拡張)に一致する可能性があります。
デフォルトの類義語は必ずしも双方向ではありません。たとえば、[phishing] の検索は "phish" と一致する可能性がありますが、[phish] の検索は "phishing" と一致しない可能性があります。
ハイフンとアンダースコアを含む単語の展開
Cloud Search では、ハイフン付きの単語とそのハイフンなしの同義語([walk-in closet] と [walk in closet] など)は別々に扱われます。また、[walk-in] や [walk_in] など、ハイフンやアンダースコアを含む単語に対して異なる最適化を適用します。
デフォルトの拡張を補正する
Cloud Search では、特定の拡張機能が保証されることはありません。双方向の同義語やドメイン固有の拡張を確実に行うには、独自の同義語を作成します。詳細については、シノニムを定義するをご覧ください。
デフォルトの解釈
Cloud Search は、データソース スキーマに基づいて自然言語の解釈を提供します。詳細については、最適なクエリ解釈のためのスキーマを構造するをご覧ください。
自然言語の解釈を無効にする
特定のクエリの自然言語解釈を無効にするには、検索リクエストで QueryInterpretationOptions.disableNlInterpretation を true に設定します。
デフォルトの最適化
Cloud Search では、次のデフォルトの最適化が提供されます。
スペル修正のブレンド: クエリ
[corpoate benefits]に対して、Cloud Search は"corpoate"と正しいスペル"corporate"を照合します。補足結果: 検索結果がほとんどないクエリの場合、Cloud Search は関連用語の許容範囲の広いセットを使用します。詳しくは、補足結果を処理するをご覧ください。
ドキュメントとクエリを正規化する
正規化では、クエリの前後に単語やフレーズを標準化します。一貫したレスポンスを確保するには、次の正規化手順を検討してください。
ドキュメントを正規化するには:
- リポジトリ内の重要な単語の正規のスペルを選択します。
- ソース ドキュメントまたはインデックス登録中にスペルを修正して、正規形と一致させます。
クエリを正規化するには:
- ユーザーのクエリを Cloud Search に送信する前にインターセプトします。
- クエリ内の単語を書き換えて、インデックス登録されたデータソースで最も一般的なスペルと一致させます。
- 書き換えられたクエリを Cloud Search に送信します。
拡張、解釈、最適化を無効にする
特定のクエリでこれらの機能を無効にするには、検索リクエストで QueryInterpretationOptions.enableVerbatimMode を true に設定します。