本頁說明程式化搜尋引擎設定檔背後的基本概念。
總覽
如果控制台無法提供您需要的自訂程度,可以考慮使用程式化搜尋 XML 格式,這樣可以賦予您更大的控制能力、靈活度以及更多強大的功能。
如要使用程式化搜尋引擎設定檔,請先透過程式化搜尋引擎控制台建立基本搜尋引擎。建立搜尋引擎後,您可以前往控制台的「總覽」頁面下載註解和內容 XML 檔案。
XML 基本概念
可延伸標記語言 (XML)XML 是一種一般用途的標記語言。是附有標記的文字。舉例來說,程式化搜尋 XML 格式包含下列標記:<Context> </Context>
和 <LookAndFeel> </LookAndFeel>
。
和所有 XML 檔案一樣,程式化搜尋引擎規格必須符合 XML 語法 (<element attribute="value">content</element>
) 且格式正確。XML 有以下規則:
- XML 規定您必須將 XML 宣告 (
<?xml version="1.0"?>
) 放在頂層標記之前,但程式化搜尋引擎設定檔則不需要。 - 所有元素都必須具有起始標記 (
<tag>
) 和結束標記 (</tag>
)。 - 所有代碼都必須正確巢狀結構。無法使用類似如下的 XML 程式碼:
<sandwich><filling> peanut butter</sandwich></filling>
。但應如下所示:<sandwich><filling> peanut butter</filling></sandwich>
。 - XML 會區分大小寫,因此請確實遵循操作說明中標記的大小寫和拼字。
- 所有屬性值都必須以雙引號 (
<element attribute="value">
) 括住。 - 所有屬性都必須在起始標記 (
<element attribute="value">
) 中定義,而非結尾標記 (</element>
)。
您可以使用註解標記 (<!-- your comment here -->
) 撰寫筆記,程式化搜尋引擎不會將這行文字剖析為 XML 程式碼。除了撰寫提醒或說明,您也可以透過註解暫時避免讓部分 XML 程式碼停止收取佣金 (例如實驗特定效果或排解問題)。不過,從控制台下載的檔案中不會保留這些註解。如果您要保留註解,則即使已註解 XML 檔案上傳到控制台,仍需保留一份副本。
您可以使用簡單的文字編輯器來建立和編輯 XML 檔案。只要使用副檔名為 .xml
(例如 cse_badminton.xml
) 的文字檔案即可。
程式化搜尋引擎的運作方式
程式化搜尋引擎包含兩個主要元件,每個元件都由 XML 檔案控制:
- 內容:內容 XML 檔案會說明搜尋引擎的基本功能,它可指定搜尋引擎的全域設定,例如是否已啟用圖片搜尋或置頂查詢。每個搜尋引擎都有專屬的內容檔案。進一步瞭解結構定義 XML 檔案。如要進一步瞭解如何為您的搜尋引擎選取最合適的檔案格式,請參閱為搜尋引擎選擇合適的格式。
- 註解:註解 XML 檔案會列出您希望搜尋引擎涵蓋的網頁或網站,並指出您對這些網站在搜尋結果中的排名偏好設定。每個網站及其相關資訊稱為「註解」。進一步瞭解註解 XML 檔案。
我們不建議您從頭開始建立這兩種檔案。請改從控制台的「總覽」頁面下載這些資料。
除了這些主要元件外,搜尋引擎也可能有以下輔助檔案:
- 促銷活動:促銷活動 XML 檔案會列出一系列由預先定義的查詢字詞所觸發的自訂結果。當使用者輸入的搜尋字詞與您的查詢字詞完全相符時,置頂查詢會出現在網頁頂端。您可以使用宣傳活動直接回答使用者的查詢、引導他們找到重要資訊,或是將他們引導至結果網頁尚未出現在結果網頁上的特別相關網頁。控制台中的「促銷活動」分頁定義促銷活動。進一步瞭解促銷活動。
- 同義詞:同義詞 XML 檔案可擴大使用者查詢內容,包含搜尋字詞的變體。例如,如果使用者搜尋「simian」搜尋引擎也會搜尋「猴子」和「ape」。在「控制台」中,同義詞是在「同義詞」分頁中定義。進一步瞭解同義詞。
各項元件如何搭配運作
結構定義 XML 檔案未指定要使用的註解檔案,且註解 XML 未參照結構定義檔案。程式化搜尋引擎會使用標籤來關聯背景資訊和註解。內容 XML 檔案包含用於識別搜尋引擎的標籤,而註解 XML 中列出的每個註解,皆會標記一或多個標籤,以識別其所屬的搜尋引擎。如果您在內容檔案中變更標籤名稱,您必須變更標記該標籤的所有註解。
雖然您可以上傳多個註解檔案,但透過控制台下載這些檔案時,程式化搜尋引擎會將所有註解檔案合併成一個註解檔案。註解檔案讓各種搜尋引擎都能彈性自訂同一個網站。舉例來說,某個搜尋引擎可能會針對某些網站進行搜尋,另一個可能刪除這些網站,而另一個搜尋引擎能宣傳這些網站。
context.xml
以下的 context.xml 檔案範例包含可識別對應搜尋引擎的標籤:
<BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> <BackgroundLabels>
annotations.xml
以下是註解檔案範例,說明每個網站 (註解) 如何與某個標籤建立關聯:
<Annotation about="code.google.com/*" score="1"> <Label name="_include_"/> </Annotation>
建立進階程式化搜尋引擎
建立進階引擎的步驟如下:
- 請 決定格式是否符合您的需求。
- 定義搜尋引擎的規格。
- 告知程式化搜尋引擎要搜尋哪些網站。
- 向程式化搜尋引擎說明搜尋結果的排名方式。
編輯程式化搜尋引擎檔案
如要使用 XML 檔案,請前往控制台的「總覽」頁面下載 XML 規格。請勿從頭開始建立檔案。請完成下列步驟:
- 從控制台的「總覽」頁面下載結構定義檔案或註解檔案。按一下「搜尋功能」部分中的 [下載] 按鈕。
- 使用可處理 UNIX 型行結尾的文字編輯器 (WordPad、Emacs 和 TextMate 可執行結尾,NotePad 則不行)。您可以用什麼方式命名檔案,只要以
.xml
的副檔名儲存檔案即可 (例如cx_global.xml
) - 為下載的檔案備份,以防編輯後未正常運作,然後還原到先前版本。
如果不建立副本,讓您編輯的版本無法正常運作,則需要對檔案偵錯,或是重新建立搜尋引擎。無趣。
- 編輯並儲存 XML 檔案。請確定您的文字編輯器是以 Unicode 文字文件儲存檔案,而不是其他檔案格式。
- 在「總覽」頁面的「搜尋功能」部分下上傳檔案。
選擇合適的格式
開始建立程式化搜尋引擎之前,請先確定最符合您需求的格式。建議您不要選用比所需功能更強大且更複雜的格式,也不要使用很快就會成長的廣告格式。
請參閱下表挑選合適的格式。
如要建立 | 使用 | 由於 | 限制 | 更多資訊 |
---|---|---|---|---|
網站數量不多的一或多個搜尋引擎 | 控制台 | 您不需要透過文字編輯器建立檔案並上傳檔案,只需填寫文字方塊,就能快速建立程式化搜尋引擎。 | 當您熟悉程式化搜尋引擎,以及在少數網站上建立搜尋引擎時,控制台最為有用。 | 開始使用 |
使用資訊提供大量網站的複雜搜尋引擎 | 內容檔案和註解檔案 | 程式化搜尋引擎檔案讓您更能掌控搜尋引擎,也能讓定義及管理網站的工作變得更簡單。 即使您打算使用內容和註解檔案建立搜尋引擎,建議您先熟悉「控制台」的相關知識。 |
您自訂的搜尋引擎越多,結果就越複雜。您必須瞭解程式化搜尋元素和屬性雖然不容易找出,但需要您花點時間。
很可惜,您還是得閱讀開發人員指南的其餘部分,這本來不是最引人注目的閱讀資料。 |
背景資訊:定義搜尋引擎規格和註解:選擇網站 |