クエリの書き換え

このページでは、ユーザーのクエリを変更して、より関連性の高い検索結果やサイトの要件に合わせた検索結果を表示する方法について説明します。

  1. 概要
  2. 絞り込みラベルを使用した検索クエリの追加
  3. 類義語による検索クエリの拡張
  4. クエリのオートコンプリート

概要

視聴者についてよく理解していれば、視聴者がどのような検索を行うかをおおまかに予測できます。検索語句を予測して、より関連性の高い検索結果をユーザーに表示することができます。

プログラム可能検索エンジンを使用すると、ユーザーのクエリに検索キーワードを追加し、ユーザーのクエリの類義語を作成できます。1 つ目の機能は絞り込みで実装され、ユーザーはこの絞り込みを適用または無視できます。一方、類義語機能は、ユーザーの操作を必要とすることなくユーザーのクエリに対して機能します。

絞り込みラベルを使用した検索クエリの追加

ユーザーのクエリに有用な検索語句を追加する絞り込みリンクを提供するには、プログラム可能検索の XML アノテーション ファイルRewrite 要素を使用します。この要素は、ユーザーが絞り込みリンクをクリックすると、ユーザーのクエリに検索キーワードを追加します。Rewrite 要素は 100 文字以内で指定できます。OR などの大文字の検索演算子を除き、すべて小文字にする必要があります。検索演算子について詳しくは、高度な検索を簡単に行うをご覧ください。絞り込みについて詳しくは、検索の絞り込みをご覧ください。

次の例は、Rewrite の使用方法を示しています。

<CustomSearchEngine>
  <Title>Universities</Title>
  <Context>
    <Facet>
      <FacetItem title="Homework">
        <Label name="assignments" mode="BOOST">
          <Rewrite>homework OR assignment</Rewrite>
        </Label>
      </FacetItem>
    </Facet>
  </Context>
</CustomSearchEngine>

この例は、「宿題」という絞り込みリンクをクリックするユーザーをサポートする方法を示しています。ユーザーが入力した検索語句に「宿題」と「課題」という検索キーワードが追加されます。

Rewrite 要素を使用した絞り込みの構造は次のとおりです。

  • Facet
    • FacetItem
      • Label name
        • Rewrite

トップへ戻る

類義語による検索クエリの拡張

類義語(検索キーワードのパターン)を使用すると、ユーザーの検索クエリを拡張できます。たとえば、金融関連の検索クエリ「interest」の場合、代替候補として「yield」、「dividend」、「coupon」などがあります。金融検索エンジンで「興味」の類義語を作成すると、ユーザーは、探している情報を見つけるために複数のパターンを入力する必要がなくなります。プログラム可能検索エンジンでは、「インタレスト」、「収益」、「配当」、「クーポン」などの関連するキーワードに関連するすべてのサイトが自動的に検索されます。

類義語が定義された検索キーワードでは、検索拡張が自動的にトリガーされます。ユーザーがその検索キーワードだけを入力した場合も、一連の他の単語を同時に入力した場合も同様です。たとえば、「ninja」という検索語句に対して同義語の「暗殺者」を定義したとします。検索クエリに「ninja」という単語が含まれている場合(「ninja」のみ、または「ninja Hotdog eating 競合」など)、クエリが拡張され、同義語の同義語が表示されます。ユーザーが「忍者 OR 暗殺者」や「忍者 OR 暗殺者 ホットドッグ コンテスト」と検索した場合のようになります。

ベスト プラクティス

自分の専門分野や関心分野に固有の一般的なクエリ用語、一般的な頭字語(「預金証書」の「CD」など)、身近な略語(「市債」の「ミュニシス」など)は、類義語を持つ有力な候補となります。ご利用の検索エンジンで十分な人気があり、同じクエリで多数の検索が行われている場合は、最もよく使用されるクエリに関するデータを統計情報ページから取得できます。[コントロール パネル] に移動し、ご利用の検索エンジンの [統計情報] リンクをクリックします。よく使用されるクエリはページの下部に表示されます。

一般的なクエリ語句の類義語を作成する必要はありません。たとえば、「UK」、「Britain」、「UK」、「United Kingdom of Great Britain」などは、ほとんどのウェブ ユーザーにとっては(技術的には同義語ではないにしても)周知のバリエーションです。Google には、こうした用語の類義語がすでに多数存在しているため、同じ手順を繰り返す必要はありません。代わりに、検索エンジンのユーザーの関心に合った、一般的な用語の類義語を作成します。たとえば、金融関連の検索エンジンでは「ボンド」が優れた候補になります。Google は、ユーザーが「James Bond」、「chemical bond」、「adhesive bond」、「emotional bond」のいずれを探しているかを認識できない場合があります。その一方、ユーザーは金融商品を探しているとわかっている場合は「固定所得保障」や「問題」などの同義語を簡単に思い浮かべることができます。

ある用語が一般的か、特異的かを判断できない場合は、Google 検索でその用語とその類似パターンをテストできます。Google 検索で検索キーワード(「サンフランシスコ」など)を入力して、新しいブラウザ ウィンドウを開きます。Google 検索ボックスに検索語句、検索演算子 OR、そのバリエーション(例: 「san francisco OR sf」)を入力します。2 つの検索結果ページを比較します。これらが完全に同じ場合は、同義語が対象となります。

類義語の作成

他の XML ファイルと同様に、シンプルなテキスト エディタを使用して類義語ファイルを作成、編集できます。テキスト ファイルを拡張子 .xml で保存するだけです(例: syn_finance.xml)。

類義語ファイルの例を次に示します。

<Synonyms>
  <Synonym term="stock">
    <Variant>equity</Variant>
    <Variant>share</Variant>
  </Synonym>
  <Synonym term="bond">
    <Variant>fixed-income security</Variant>
    <Variant>issue</Variant>
    <Variant>high yield debt</Variant>
  </Synonym>
</Synonyms>

次の階層に示すように、類義語ファイルには 1 つの要素と 1 つの子要素が含まれます。この子要素は複数の兄弟要素を持つことができます。

  • Synonyms (1 つのみ)
    • Synonym term (複数の兄弟要素を指定可能)
      • VariantSynonym ごとに最大 10 個)

Synonym 子要素の属性値に検索キーワードを作成し、Variant 要素でそれぞれの類義語を定義します。検索語句とその類義語のバリエーションは、単一の単語(「クッキー」など)やフレーズ(「バターミルク クッキー」や「こぼしたミルク」など)になります。

上限

次の表に、類義語ファイルの上限を示します。

項目 最大許容回数
検索キーワードの数(Synonym term 要素) 複数の検索語句。ただし、検索エンジンごとにパターンの合計数が 500 個を超えないようにしてください。
各検索キーワードのパターン(Variant 要素)の数 10

 

検索エンジンのパターン(Variant 要素)の合計数 2000
ファイルサイズ 500KB
ファイル数 必要な数(アカウント内のすべてのファイルの合計サイズが 4 MB を超えない限り)

トップへ戻る

クエリのオートコンプリート

オートコンプリートは、ユーザーが検索ボックスに入力する際に表示されるクエリ候補のリストです。

図 1: 検索ボックスに数文字を入力するとプルダウン リストが表示され、さまざまな検索クエリの選択肢を確認できます。

旅行サイトのプログラム可能検索エンジンに「p-u-e-r」と入力すると、プエルトリコ、プエルト バラータのホテル、プエルト バラータでの休暇などのオプションを含むプルダウン リストが表示されます。

オートコンプリートに使用されるオプションのクエリのリストは、ウェブサイトのコンテンツと、検索キーワードの人気度から部分的に取得されます。ただし、コントロール パネルで、または XML ファイルでの一括アップロードによって、語句を追加または削除してオートコンプリートをカスタマイズできます。

オートコンプリートの有効化

プログラム可能検索要素を使用して検索エンジンでオートコンプリートを有効にするには:

  1. 検索エンジンの [検索機能] ページで、[オートコンプリート] セクションまでスクロールします。
  2. [オートコンプリートを有効にする] チェックボックスをオンにします。

検索エンジンの [検索機能] ページの [オートコンプリート] セクションで個々の語句を追加または削除できます。また、XML を使用してすべての語句をアップロードすることもできます。追加した語句は、すべての検索クエリについて、アルゴリズムによって生成される語句の上に表示されます。

オートコンプリートの語句が検索エンジンに表示されるまでには、最大 48 時間かかります。

語句を一括で追加または削除するには、オートコンプリート XML ファイルをアップロードします。他の XML ファイルと同様に、シンプルなテキスト エディタを使用してオートコンプリート ファイルを作成、編集できます。 テキスト ファイルを拡張子 .xml で保存するだけです(例: autocompletion_finance.xml)。

オートコンプリート語句の追加と削除

アップロードできるオートコンプリート ファイルの例を以下に示します。

<Autocompletions>
  <Autocompletion term="cake" type="1"/>
  <Autocompletion term="strawberry.*" type="2" match="2"/>
  <Autocompletion term="vanilla" type="2"/>
</Autocompletions>

このサンプルコードでは、「りんご」はオートコンプリートの候補のリストに含まれていますが、「vanilla」と「strawberry」で始まる語句はオートコンプリート語句としてユーザーに表示されません。

次の階層に示すように、オートコンプリート ファイルには 1 つの要素と 1 つの子要素が含まれます。この子要素は複数の兄弟要素を持つことができます。

  • Autocompletions(1 つのみ)
    • Autocompletion(複数の兄弟要素を指定可能)

次の表に、オートコンプリートの属性名を示します。

属性名 説明
term 含めるまたは除外する個々の語句または正規表現です。 追加または除外するオートコンプリート語句です。たとえば、ユーザーに表示されるオートコンプリート語句のリストに「ストーム シャドウ」を追加する場合は、値として「ストーム シャドウ」を追加します。同じ語句を複数の Autocompletion エントリで使用するとエラーになります。1 つの用語は半角 100 文字(全角 50 文字)まで入力できます。100 文字を超える語句は無視されます。
type 語句をオートコンプリートに含めるか、オートコンプリートから除外するかを指定します。 次のいずれかを指定します。
  • 1 - 用語を含めます。
  • 2 - 語句を除外します。
  • match 省略可。語句を完全に一致させるか、正規表現で一致させるかを指定します。 次のいずれかを指定します。
  • 1 - デフォルト。完全一致。
  • 2 - 正規表現の場合。正規表現を指定できるのは除外された語句のみです。
  • トップへ戻る