このページでは、検索エンジンから返される検索結果のランキングを調整する方法について説明します。
概要
検索エンジンでカバーしてほしいサイトのリストを編集したものの、いくつかのクエリをテストしてみると、検索結果が自分の思い描いていたものと完全には一致しないとします。クエリとの関連性が最も高いと思われる結果は、ページの上部に表示されません。また、お気に入りの研究機関や自身のウェブサイトのウェブページを優先する場合も考えられます。結果を昇格または降格することで、均一化できます。プログラム可能検索エンジンでは、キーワード、重み付けされたラベル、スコアの 3 つの方法で結果を調整できます。キーワードと重み付けはコンテキスト ファイルで定義され、スコアはアノテーション ファイルで定義されます。
- キーワードを使用すると、特定のウェブページを検索結果に表示し、特定のテーマに関するより多くの検索結果を表示できます。
- 重み付けされたラベルは、プログラム可能検索エンジンに対して、サイトを除外するか、昇格するか、降格するかを指定します。サイトの昇格または降格の程度は、ラベルに適用する重み付けによって異なります。
- スコア。個々のアノテーションに適用され、重み付けされたラベルの影響を緩和するか、逆にします。ランキングの微調整に別のレイヤが追加されます。
ラベルの重み付けとアノテーションのスコアは、検索結果のランキングを変更するための主要な設定項目です。どちらも -1.0
~+1.0
の範囲の値を持ちます。サイトの昇格と降格を行うには、スコアと重み付けでダイヤルを回す(値を増減する)ことができます。
ユーザーはランキングに強い影響力を持ちますが、結果を絶対に制御することはできません。結果の昇格または降格は、ウェブページの関連性、キーワードの選択、ラベルの重み、アノテーションのスコアなど、多くのパラメータによって決まります。
キーワードで成果を向上
キーワードは、結果を変更する最も簡単な方法です。プログラム可能検索エンジンは キーワードを含むウェブページをその主題に関するより多くの検索結果を取得できます。検索結果の表示が浅いと思われる場合は、キーワードを追加してみてください。 プログラム可能検索エンジンは、指定されたキーワードを含むウェブページを優先しますが、そのキーワードを含まないウェブページを順位付けしたり、除外したりすることはありません。
キーワードを使用すると、ユーザーの意図を検索エンジンに適応させることができます。たとえば、ヨガの検索エンジンで「マット」を検索したユーザーは、「ミラー アナロジー テスト」や「ハウスマット」ではなく、実際には「ヨガマット」を検索しています。検索エンジンの主な目的と、ユーザーが使用する検索クエリのコンテキストを考慮してください。検索エンジンの例では「ヨガ」はわかりやすいキーワードですキーワードの範囲が広すぎる、またはカテゴリが多すぎるキーワードは使用しないでください。たとえば、「エクササイズ」や「東洋の練習」を検索すると、ヨガとは無関係のウェブページが数多く取り込まれます。最適なキーワードは、検索エンジンがカバーするサイトのコンテンツを表します。
まず 1 つの単語から始めて、期待する結果が得られるかどうかを確認します。十分な結果が得られない場合は、複数のキーワードを使用してみてください。フレーズも使用できますが、これは、引用符で囲まれた一連の単語です(例: "ヨガのポーズ")。ただし、1 単語のキーワードのほうが効果的です。プログラム可能検索エンジンでは、yoga pose stretch
を「ヨガ」、「ストレッチ」、「ポーズ」の 3 つのキーワードとして解釈します。
キーワードは互いに独立しているわけではなく、相互に連携しています。たとえば「ヨガ」と「ポーズ」というキーワードを設定している場合、「ヨガ」を含むウェブページと「ポーズ」を含むウェブページはより上位に表示されますが、「ヨガ」と「ポーズ」の両方を含むウェブページはより上位に表示されます。
例: キーワード
ヨガのプログラム可能な検索エンジンの 2 つのバージョンで 「mat」の検索結果を比較してみましょう
図 1: キーワードを使用しない検索エンジンでの検索クエリ「mat」に対する結果。(結果セット全体を表示するには、画像をクリックします)。
図 2: 「yoga」というキーワードが設定された検索エンジンによる、検索語句「mat」に対する結果。
キーワード「yoga」を含むバージョンでは、このキーワードを含むウェブページが検索結果ページに表示されます。
キーワードを作成する
100 文字以内であれば、必要に応じていくつでもキーワードを作成できます。キーワードを作成する最も簡単な方法は、コントロール パネルの [概要] ページにある [基本] セクションを使用することです。このタブでは、さまざまなキーワードを試したり、結果ページへの影響を確認したりできます。結果に満足できない場合は、キーワードを簡単に削除して別のキーワードを試すことができます。
コンテキスト ファイル内にキーワードを作成する場合は、CustomSearchEngine
要素の keywords
属性を使用してキーワード値を定義します。複数のキーワードは 1 つのスペースで区切ります。フレーズは引用符で囲みます。句読点("
)または文字エンティティ("
)のいずれかを使用できます。
<CustomSearchEngine keywords="asana "yoga postures""> </CustomSearchEngine>
ラベルによる検索結果の変更
検索結果を変更するもう 1 つの方法は、ラベルを使用する方法です。ラベルは検索結果のランキングの主役であり、サイトの扱い方を決定します。
検索エンジンのラベルと絞り込みラベルの 2 種類のラベルを使用できます。検索エンジンのラベルは、検索エンジンの対象となるサイトを決定します。これらはユーザーには表示されず、バックグラウンドで実行されます。そのため、その親要素は BackgroundLabels
と呼ばれます。一方、絞り込みラベルはユーザーに表示され、リンクとして表示されます。絞り込みについて詳しくは、検索の絞り込みをご覧ください。このページのほとんどは検索エンジンのラベルに重点を置いていますが、modes、重み付け、
スコアは検索エンジンと絞り込みの両方のラベルで同じように機能します。
次のコードは、コンテキスト ファイル内の 2 種類のラベルを示しています。
<!--Search engine labels--> <BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> <lt;/BackgroundLabels> <!--Refinement label--> <Facet> <FacetItem title="Lectures"> <Label name="lectures" mode="BOOST" weight="0.8"> <Rewrite>lecture OR lectures</Rewrite> </Label> </FacetItem> </Facet>
コントロール パネルから プログラム可能検索エンジンを初めて作成すると、プログラム可能検索エンジンによって 2 つの検索エンジンのラベルが作成されます。ラベルには、サイトの扱い方を決定するモードがあります。1 つは排他的(mode="ELIMINATE"
)で、もう 1 つは包含的(mode="FILTER"
)です(プログラム可能検索エンジンの作成後に、包含ラベルのモードを「FILTER」から「BOOST」に変更できます)。
ラベルの使用
検索エンジンのラベルを使用する手順は次のとおりです。
- コンテキスト ファイルで、検索エンジンのラベルを作成または再定義します。
- アノテーション ファイルで、ラベルを使用してサイトにタグを付けます。
例: ラベル付きのコンテキスト ファイル
以下は、検索エンジンのラベルを含むコンテキスト ファイルの簡略化された例です。
<CustomSearchEngine keywords="climate "global warming" "greenhouse gases""> <Title>RealClimate</Title> <Description>"Climate change"</Description> <Context> <BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> </BackgroundLabels> </Context> </CustomSearchEngine>
ラベルのモードの定義
サイトの昇格、降格、除外は、関連付けられている検索エンジンのラベルによって異なります。検索エンジンのラベルには次のモードがあります。
注: 大文字と小文字は区別してください。モードには大文字を使用します。
モード | 次のことを行いますか。 | このモードは次の場合に使用します。 |
---|---|---|
ELIMINATE |
このラベルでタグ付けされたサイトを検索エンジンから除外します。 | Google 検索で上位に表示されるものの、ユーザーにとってはそれほど好ましくないウェブページを除外します。 たとえば、ハムスターの科学的研究のための検索エンジンを作成する場合は、 |
FILTER |
このラベルでタグ付けされたサイトのみが含まれ、その他はすべて除外されます。 | 自分のサイト、関連サイト、特定のテーマに関連するサイトのみを検索エンジンで検索できるようにしたい場合。 このような検索エンジンの対象範囲は少数のサイトに限定されているため、検索結果のランキングをより詳細に制御できます。重み付けを使用して検索結果の順序を変更する方法については、次のセクションで説明します。 たとえば、ウェブサイト専用の検索エンジンを作成する場合は、 |
BOOST |
検索エンジン内のすべてのウェブサイトが含まれますが、このラベルの付いたサイトの表示順位が上がります(または順位が下がります)。サイトの昇格と降格の度合いは、割り当てるウェイトによって異なります。 | 一部のサイトを重視し、それ以外のサイトを完全に除外しない、幅広い検索エンジンが望まれます。
たとえば、広範囲をカバーする検索エンジンを作成したいが、自分のウェブサイト(史上最高のウェブサイト)に限りがある場合は、 |
重み付けされたラベルの作成
サイトを含むラベル、昇格サイト、または除外サイトを含むラベルを作成すると、そのラベルに重み付けを割り当てることができます。重み付けを使用すると、タグ付けされたサイトをラベルでどの程度昇格または降格するかを定義できます。重みの値は -1.0
~+1.0
の範囲で指定できます。重みの範囲によって、サイトを細かく制御できます。ラベルの重み付けが正の場合はそのタグでタグ付けされたサイトが強調され、負の重み付けは非強調となります。
次のコードは、重み付けされたラベルを示しています。
<BackgroundLabels> <Label name="_include_" mode="FILTER" weight="0.65"/> <Label name="_exclude_" mode="ELIMINATE"/> </BackgroundLabels>
重みが定義されていないブーストとフィルタのラベル(プログラム可能検索エンジンによって生成されたものなど)には、デフォルトの重みが +0.7
になっています。生成されたラベルがサイトを宣伝する能力を高めるには、値を +0.7
より大きい値に変更してください。デフォルト値よりも低い値に変更すると、サイトのランキングに対するラベルのブースト効果が弱まります。逆にラベルに負の重みを割り当てると、そのラベルでサイトの順位が下げられるか抑制されます。-1.0
に近づくと、検索結果でサイトの掲載順位が上がることがますます難しくなります。-1.0
では、ランキングの高いサイトであっても、順位を下げるのは困難です。
次の表に、ラベルのモードと重みに基づいて結果を調整する方法を示します。
モード | 重量 | 効果 |
---|---|---|
BOOST |
+1.0 |
サイトを大幅に宣伝します。ただし、必ずしもタグ付けされたサイトが常に検索結果の上位に表示されるわけではなく、他のサイトが除外されるわけでもありません。これは、モードを FILTER に設定するのとは異なります。ラベルに一致する結果が 1 つもない場合でも、結果が表示されることがあります。検索クエリとの関連性が極めて高い検索結果が、好意度が高いものの無関係なサイトよりも優先されることもあります。重み付けしたラベルでタグ付けしたサイトを、他のすべての検索結果を除外して上位の検索結果として表示するという確信がある場合は、ブーストラベルではなくフィルタラベルを使用する必要があります。 |
BOOST |
-1.0 |
サイトを大幅に降格させます。これは、モードを ELIMINATE に設定するのとは異なります。関連性の高い結果は引き続き表示される可能性があるためです。
サイトの掲載順位を上げるために、アップストリームで競うことになりますが、サイトが完全にブロックされるわけではなく、 |
BOOST |
未定義 | 重みを定義しない場合(たとえば <Label name="standard" mode="BOOST"/> )は、暗黙的に +0.7 の重みになります。 |
FILTER |
+1.0 |
選択したサイトを大幅にプロモーションします。このモードを FILTER に設定した場合、プログラム可能検索エンジンはラベルに一致するサイトのみを表示します。選択したサイトがユーザーのクエリに関連していない場合、結果は表示されません。 |
FILTER |
-1.0 |
選択したサイトを結果から効果的にブロックします。これは、サイトに除外ラベルを付加した場合のようになります。 |
FILTER |
未定義 | 重みを定義しない場合(たとえば <Label name="standard" mode="FILTER"/> )は、暗黙的に +0.7 の重みになります。 |
ELIMINATE |
重量なし | サイトをブロックします。ラベルに一致するサイトは表示されません。関連するすべての結果に除外ラベルが付いている場合は、空の結果ページが表示される可能性があります。これは、ブーストタイプの検索エンジンではなく、フィルタタイプの検索エンジンを使用した場合に発生する可能性が高くなります。 |
重みの異なる複数のラベルを作成し、必要に応じてサイトに適用できます。たとえば、サイトを積極的に促進するラベルと、軽度に促進するラベルを作成することが考えられます。重み付けされたラベルはいくつでも作成できますが、ある程度の時間が経過すると、管理が難しくなることがあります。サイトのランキングをより細かく管理するには、スコアを使用するのが効果的です。これについては、次のセクションで説明します。
ラベルによるサイトのタグ付け
ラベルを定義したら、そのラベルを使用してサイトのタグ付けを開始できます。各アノテーションには複数のラベルを設定できます。つまり、同じサイトを他の検索エンジンで使用したり、異なるランク付けを行ったりできます。
<Annotations> <Annotation about="webcast.berkeley.edu/*" score="1"> <Label name="cse_university_boost_highest"/> <Label name="cse_bicycles_exclude"/> <Label name="cse_hamsters_filter"/> </Annotation> </Annotations>
ラベルの効果の調整
スコアを使用して、ラベルの影響を調整できます。特定のサイトに対するラベルの効果を弱めたり、逆にしたりできます。Annotation
要素の score
属性には、-1.0
~1.0
の範囲の値を指定できます。スコアが 0
の場合、サイトのランキングに対するラベルの影響が取り除かれ、スコアが 1
の場合はすべての影響が適用されます。-1
の場合は、影響が完全に取り消されます。0
~1
、または -1
~0
の値(0.55
など)は、ラベルの影響を微調整するための値です。アノテーションにスコアを割り当てない場合、カスタム検索はラベルのすべての効果をサイトに適用します。これは、スコアに 1
を割り当てたと想定されます。
次の表に、スコアでラベルの影響を調整する方法を示します。
モード | 重量 | スコア | 効果 |
---|---|---|---|
指定なし | 指定なし | なし | アノテーションにスコア 1.0 を付与するのと同じです。ラベルはサイト全体に適用されます。 |
BOOST |
+1.0 |
-1.0 |
これは、BOOST ラベルを逆にして、重み -1.0 を設定するのと同じです。サイトの順位が積極的に下がる。 |
BOOST |
-1.0 |
-1.0 |
これは、BOOST ラベルを逆にして、重み +1.0 を設定するのと同じです。サイトを積極的に宣伝している。 |
FILTER |
+1.0 |
-1.0 |
サイトに ELIMINATE ラベルを付加するのと同じです。このサイトは完全に除外されます。 |
FILTER |
-1.0 |
-1.0 |
これは、FILTER ラベルを逆にして、重み +1.0 を設定するのと同じです。サイトを積極的に宣伝している。 |
ELIMINATE
|
重量なし | -1.0 |
ELIMINATE ラベルをスコア +1.0 のフィルタラベルに変換することと同じです。サイトを積極的に宣伝している。 |
例: スコアのコード
次の例では、同じ検索エンジンのラベルでタグ付けされている 3 つのサイトがあります。ただし、各アノテーションのスコアが異なり、ラベルを適用する強度が異なるため、3 つの異なるサイトでラベルの効果は均一ではありません。
<Annotations> <Annotation about="*.edu/*" score="0.0001"> <Label name="vision_label"/> </Annotation> <Annotation about="*.ucsd.edu/*" score="0.7"> <Label name="vision_label"/> </Annotation> <Annotation about="*.vision.ucsd.edu/*" score="1"> <Label name="vision_label"/> </Annotation> </Annotations>
3 つのアノテーションすべてに vision_label
タグがありますが、プログラム可能検索エンジンでは、スコアを考慮して異なる形で処理します。vision.ucsd.edu
からの結果は非常に高く、ucsd.edu
からの結果はやや優先され、.edu
のトップレベル ドメインからの結果は他のサイトよりもやや優れています。