構成ファイルを使用してプログラム可能検索エンジンを作成する

このページでは、プログラム可能検索エンジンの構成ファイルに関する基本的な概念について説明します。

  1. 概要
  2. プログラム可能検索エンジンとは
  3. コンポーネントが連携する仕組み
  4. 検索エンジンを作成する
  5. プログラム可能検索エンジンのファイルの編集
  6. 適切なフォーマットの選択

概要

コントロール パネルでは、必要なレベルのカスタマイズができない場合は、プログラム可能な検索の XML 形式の使用を検討してください。この形式を使用すると、制御性と柔軟性が高く、より強力な機能を利用できます。

プログラム可能検索エンジンの構成ファイルを使用するには、まずプログラム可能検索エンジンのコントロール パネルを使用して基本的な検索エンジンを作成します。検索エンジンを作成したら、コントロール パネルの [概要] ページからアノテーションとコンテキスト XML ファイルをダウンロードできます。

XML の基本

拡張マークアップ言語(XML)は汎用マークアップ言語です。これは、読み取れるタグが付いたテキストです。たとえば、プログラム可能検索の XML 形式には、<Context> </Context><LookAndFeel> </LookAndFeel> のタグが含まれます。

他の XML ファイルと同様に、プログラム可能検索エンジンの仕様は、XML 構文(<element attribute="value">content</element>)に従い、正しい形式で記述する必要があります。XML には次のルールがあります。

  • XML では、最上位タグの前に XML 宣言(<?xml version="1.0"?>)を付ける必要がありますが、プログラム可能検索エンジンの構成ファイルでは必須ではありません。
  • すべての要素に開始タグ(<tag>)と終了タグ(</tag>)が必要です。
  • すべてのタグを適切にネストする必要があります。<sandwich><filling> peanut butter</sandwich></filling> のような XML コードは使用できません。代わりに、<sandwich><filling> peanut butter</filling></sandwich> のようにします。
  • XML では大文字と小文字が区別されるため、手順に記載されているタグの大文字と小文字の使い方とスペルを慎重に考慮してください。
  • 属性値はすべて二重引用符(<element attribute="value">)で囲む必要があります。
  • すべての属性は、終了タグ(</element>)ではなく、開始タグ(<element attribute="value">)で定義する必要があります。

コメントタグ(<!-- your comment here -->)を使用してメモを作成できますが、プログラム可能検索エンジンは、そのテキスト行を XML コードとして解析しません。コメントは、リマインダーや説明を書く以外に、一時的に利用停止の XML コードを記述することもできます(特定の効果を試したい場合や、問題をトラブルシューティングしたい場合など)。ただし、コントロール パネルからダウンロードしたファイルにこれらのコメントは保存されません。コメントを残しておきたい場合は、コメントをコントロール パネルにアップロードした後も、コメント付きの XML ファイルのコピーを保管しておいてください。

XML ファイルの作成と編集には、シンプルなテキスト エディタを使用できます。ファイル拡張子 .xml を付けてテキスト ファイルを保存します(例: cse_badminton.xml)。

トップへ戻る

プログラム可能検索エンジンとは

プログラム可能検索エンジンには主に 2 つのコンポーネントがあり、それぞれ XML ファイルで制御されています。

  • コンテキスト: コンテキスト XML ファイルには、検索エンジンの基本的な機能が記述されています。画像検索やプロモーションを有効にするかどうかなど、検索エンジンの全般設定を指定します。検索エンジンごとに独自のコンテキスト ファイルがあります。コンテキスト XML ファイルの詳細。検索エンジンに最適なファイル形式の選択について詳しくは、検索エンジンに適したファイル形式を選択するをご覧ください。
  • アノテーション: アノテーション XML ファイルには、検索エンジンの対象にするウェブページやウェブサイトをリストアップし、検索結果でのサイトのランク付けに関する設定を指定します。各サイトとその関連情報はアノテーションと呼ばれます。アノテーション XML ファイルの詳細

これらのファイルをゼロから作成することはおすすめしません。代わりに、コントロール パネルの [概要] ページからダウンロードしてください。

これらの主要コンポーネントの他にも、検索エンジンには以下の補助ファイルがあります。

  • プロモーション: プロモーション XML ファイルには、事前定義された一連の検索語句によってトリガーされる一連のカスタム結果がリストされます。ユーザーがいずれかの検索語句と完全に一致する検索語句を入力すると、ページの上部にプロモーションが表示されます。プロモーションを使用して、ユーザーのクエリに直接答えたり、重要な情報にユーザーを導いたり、検索結果ページの上部には表示されていながら特に関連性の高いウェブページを表示したりすることが可能です。プロモーションは、コントロール パネルの [プロモーション] タブで定義します。プロモーションの詳細
  • 類義語: 類義語 XML ファイルでは、ユーザーのクエリを拡張して検索キーワードのバリエーションを含めることができます。たとえば、ユーザーが「simian」を検索すると、この検索エンジンでは「サル」も検索されます「ape」などで検索します。類義語はコントロール パネルの [類義語] タブで定義します。類義語の詳細

コンポーネントが連携する仕組み

コンテキスト XML ファイルでは、使用するアノテーション ファイルを指定しません。また、アノテーション XML はコンテキスト ファイルを参照しません。プログラム可能検索エンジンは、ラベルを使用してコンテキストとアノテーションを関連付けます。コンテキスト XML ファイルには検索エンジンを識別するラベルが含まれており、アノテーション XML に記述された各アノテーションには、検索エンジンを識別する 1 つ以上のラベルがタグ付けされます。コンテキスト ファイル内のラベルの名前を変更する場合は、そのラベルでタグ付けされたすべてのアノテーションを変更する必要があります。

複数のアノテーション ファイルをアップロードすることもできますが、コントロール パネルからダウンロードする場合は、すべてのアノテーション ファイルを 1 つのアノテーション ファイルに統合します。アノテーション ファイルを使用すると、同じサイトをさまざまな検索エンジン向けに柔軟にカスタマイズできます。たとえば、ある検索エンジンでは検索対象を特定のサイトに限定し、別の検索エンジンではそれらのサイトを除外し、別の検索エンジンではそれらのサイトを宣伝できます。

context.xml

適用する検索エンジンを識別するラベルを含む context.xml ファイルの例を次に示します。

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

以下に、各サイト(アノテーション)とラベルの関係を示すアノテーション ファイルの例を示します。

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

トップへ戻る

高度なプログラム可能検索エンジンの作成

高度なエンジンを作成するには、次の手順を実施します。

  1. ニーズに適した 形式を決定します。
  2. 検索エンジンの仕様を定義します。
  3. プログラム可能検索エンジンに、検索するサイトを指示する
  4. プログラム可能検索エンジンに検索結果のランク付け方法を指示する

プログラム可能検索エンジンのファイルの編集

XML ファイルを操作するには、コントロール パネルの [概要] ページから XML 仕様をダウンロードします。ファイルをゼロから作成しないでください。手順は次のとおりです。

  1. コントロール パネルの [概要] ページからコンテキスト ファイルまたはアノテーション ファイルをダウンロードします。[検索機能] で [ダウンロード] ボタンをクリックします。
  2. UNIX 形式の行末を処理できるテキスト エディタを使用します(WordPad、Emacs、TextMate は機能しますが、NotePad は動作しません)。ファイルに名前を付けてください。ただし、ファイル拡張子 .xml を付けて保存してください(例: cx_global.xml)。
  3. ダウンロードしたファイルのバックアップ コピーを作成しておくと、編集したバージョンが意図したとおりに機能せず、以前のバージョンに戻す必要がある場合に有用です。

    コピーを作成し直さず、編集したバージョンが正しく機能しない場合は、ファイルをデバッグするか、検索エンジンを最初から作り直す必要があります。面白くない。

  4. XML ファイルを編集して保存します。テキスト エディタで、ファイルが他のファイル形式ではなく Unicode テキスト ドキュメントとして保存されていることを確認します。
  5. [概要] ページの [検索機能] セクションでファイルをアップロードします。

適切なフォーマットの選択

プログラム可能検索エンジンの作成を開始する前に、ニーズに最適な形式を決定します。必要以上に強力で複雑な形式を選ぶのは避けたいものです。また、すぐに増えてしまっている形式を使いたくはありません。

次の表を参考にして適切な形式を選択してください。

作成 使用 なぜなら、 制限事項 詳細
サイト数が少ない検索エンジンが 1 つ以上 コントロール パネル テキスト エディタでファイルを作成してアップロードしなくても、テキスト ボックスに入力するだけでプログラム可能検索エンジンを簡単に作成できます。 コントロール パネルは、主にプログラム可能検索エンジンについての理解を深めたり、サイトの数が少ない検索エンジンを作成したりする場合に便利です。 スタートガイド
多数のサイトを使用し、フィードを使用する複雑な検索エンジン コンテキスト ファイルとアノテーション ファイル

プログラム可能検索エンジンのファイルを使用すると、検索エンジンをより詳細に管理し、サイトを定義して管理するタスクが非常に簡単になります。

コンテキスト ファイルとアノテーション ファイルを使用して検索エンジンを作成する場合でも、コントロール パネルの使い方をよく理解しておくことをおすすめします。

検索エンジンをカスタマイズすればするほど、検索エンジンは複雑になります。プログラム可能な検索の要素と属性を習得する必要がありますが、習得は困難ですが、ある程度の時間を費やす必要があります。

残念ながら、デベロッパー ガイドの残りの部分は読む必要がありますが、それほど興味深い資料ではありません。

コンテキスト: 検索エンジン仕様の定義アノテーション: サイトの選択

トップへ戻る