Tạo Công cụ tìm kiếm có thể lập trình bằng các tệp cấu hình

Trang này giới thiệu các khái niệm cơ bản đằng sau tệp cấu hình của Công cụ tìm kiếm có thể lập trình.

  1. Tổng quan
  2. Có gì trong Công cụ tìm kiếm có thể lập trình
  3. Cách các thành phần hoạt động cùng nhau
  4. Tạo một công cụ tìm kiếm
  5. Chỉnh sửa tệp của Công cụ tìm kiếm có thể lập trình
  6. Chọn định dạng phù hợp

Tổng quan

Nếu Bảng điều khiển không cung cấp cho bạn mức độ tuỳ chỉnh mà bạn cần, hãy cân nhắc sử dụng định dạng XML của công cụ Tìm kiếm có thể lập trình. Định dạng này cho phép bạn kiểm soát tốt hơn, linh hoạt hơn và có thể sử dụng các tính năng mạnh mẽ hơn.

Để sử dụng các tệp cấu hình của Công cụ tìm kiếm có thể lập trình, hãy bắt đầu bằng cách tạo một công cụ tìm kiếm cơ bản bằng Bảng điều khiển của Công cụ tìm kiếm có thể lập trình. Sau khi tạo công cụ tìm kiếm, bạn có thể tải các chú thích và tệp XML ngữ cảnh của mình xuống từ trang Tổng quan của Bảng điều khiển.

Khái niệm cơ bản về XML

Ngôn ngữ đánh dấu mở rộng XML là một ngôn ngữ đánh dấu đa năng. Đó là văn bản có các thẻ mà bạn có thể đọc được. Ví dụ: Định dạng XML của Công cụ tìm kiếm có thể lập trình bao gồm các thẻ sau: <Context> </Context><LookAndFeel> </LookAndFeel>.

Cũng như với mọi tệp XML, thông số kỹ thuật của Công cụ tìm kiếm có thể lập trình phải tuân theo cú pháp XML (<element attribute="value">content</element>) và được định dạng đúng cách. XML có các quy tắc sau:

  • XML yêu cầu bạn phải khai báo XML (<?xml version="1.0"?>) trước các thẻ cấp cao nhất, nhưng tệp cấu hình của Công cụ tìm kiếm có thể lập trình không yêu cầu điều đó.
  • Tất cả các phần tử của bạn phải có thẻ mở (<tag>) và thẻ đóng (</tag>).
  • Tất cả các thẻ của bạn phải được lồng đúng cách. Bạn không được có mã XML như sau: <sandwich><filling> peanut butter</sandwich></filling>. Thay vào đó, giá trị này sẽ có dạng như sau: <sandwich><filling> peanut butter</filling></sandwich>.
  • XML có phân biệt chữ hoa chữ thường, vì vậy, hãy cẩn thận tuân thủ cách viết hoa và chính tả của các thẻ trong hướng dẫn.
  • Tất cả giá trị thuộc tính phải được đặt trong dấu ngoặc kép (<element attribute="value">).
  • Tất cả các thuộc tính phải được định nghĩa trong thẻ mở (<element attribute="value">), chứ không phải trong thẻ đóng ( </element>).

Bạn có thể tự viết ghi chú bằng thẻ nhận xét (<!-- your comment here -->). Công cụ tìm kiếm có thể lập trình sẽ không phân tích cú pháp dòng văn bản đó dưới dạng mã XML. Ngoài việc viết lời nhắc hoặc nội dung mô tả, bạn có thể dùng nhận xét để tạm thời không trả phí hoa hồng cho một số mã XML (có thể vì bạn muốn thử nghiệm một số hiệu ứng nhất định hoặc muốn khắc phục vấn đề). Tuy nhiên, những nhận xét này không được lưu giữ trong tệp mà bạn tải xuống từ Bảng điều khiển. Nếu muốn giữ nhận xét, bạn nên giữ bản sao các tệp XML đã nhận xét ngay cả sau khi bạn tải chúng lên Bảng điều khiển.

Bạn có thể sử dụng một trình chỉnh sửa văn bản đơn giản để tạo và chỉnh sửa tệp XML. Bạn chỉ cần lưu tệp văn bản có đuôi tệp là .xml (ví dụ: cse_badminton.xml).

Trở lại đầu trang

Công cụ tìm kiếm có thể lập trình có gì?

Một Công cụ tìm kiếm có thể lập trình có hai thành phần chính, mỗi thành phần do một tệp XML kiểm soát:

  • Ngữ cảnh: Tệp XML ngữ cảnh mô tả các tính năng cơ bản của công cụ tìm kiếm. Đoạn mã này chỉ định cài đặt chung của công cụ tìm kiếm, chẳng hạn như liệu tính năng Tìm kiếm hình ảnh hoặc kết quả được thăng hạng có được bật hay không. Mỗi công cụ tìm kiếm đều có tệp ngữ cảnh riêng. Thông tin khác về tệp XML theo bối cảnh. Để biết thêm thông tin về cách chọn định dạng tệp phù hợp nhất cho công cụ tìm kiếm của bạn, hãy xem phần Chọn định dạng phù hợp cho công cụ tìm kiếm của bạn.
  • Chú thích: Tệp XML chú thích liệt kê các trang hoặc trang web bạn muốn công cụ tìm kiếm bao gồm và cho biết bất kỳ tùy chọn nào bạn có về cách những trang web này được xếp hạng trong kết quả tìm kiếm của bạn. Mỗi trang web và thông tin liên quan được gọi là một chú giải. Thông tin khác về tệp XML của chú thích.

Bạn không nên tạo các tệp này từ đầu. Thay vào đó, hãy tải các báo cáo đó xuống từ trang Tổng quan của Bảng điều khiển.

Ngoài những thành phần chính này, công cụ tìm kiếm cũng có thể có các tệp phụ sau:

  • Khuyến mãi: Tệp XML về chương trình khuyến mãi liệt kê một loạt kết quả tuỳ chỉnh được kích hoạt bởi một nhóm cụm từ truy vấn đã xác định trước. Khi người dùng nhập một nội dung tìm kiếm khớp chính xác với một trong các cụm từ tìm kiếm của bạn, quảng cáo sẽ xuất hiện ở đầu trang. Bạn có thể sử dụng quảng cáo để trực tiếp trả lời các thắc mắc của người dùng, đưa họ đến thông tin quan trọng hoặc đưa họ đến các trang web chưa ở đầu trang kết quả nhưng lại đặc biệt có liên quan. Trong Bảng điều khiển, chương trình khuyến mãi được xác định trong thẻ Khuyến mãi. Thông tin khác về chương trình khuyến mãi.
  • Từ đồng nghĩa: Tệp XML chứa từ đồng nghĩa mở rộng cụm từ tìm kiếm của người dùng để bao gồm cả các biến thể của cụm từ tìm kiếm đó. Ví dụ: nếu người dùng tìm kiếm "simian", thì công cụ tìm kiếm cũng sẽ tìm kiếm "khỉ" và "vượn". Trong Bảng điều khiển, các từ đồng nghĩa được xác định trong thẻ Từ đồng nghĩa. Thông tin khác về các từ đồng nghĩa.

Cách các thành phần hoạt động cùng nhau

Tệp XML ngữ cảnh không chỉ định tệp chú thích để sử dụng và XML chú thích không tham chiếu đến tệp ngữ cảnh. Công cụ tìm kiếm có thể lập trình dùng nhãn để liên kết ngữ cảnh và chú thích. Tệp XML ngữ cảnh bao gồm các nhãn xác định công cụ tìm kiếm và mỗi chú thích được liệt kê trong XML chú thích được gắn thẻ với một hoặc nhiều nhãn xác định công cụ tìm kiếm chứa nó.Nếu bạn thay đổi tên nhãn trong tệp ngữ cảnh, bạn phải thay đổi tất cả các chú thích đã được gắn thẻ với nhãn đó.

Mặc dù bạn có thể tải nhiều tệp chú thích lên, nhưng khi bạn tải các tệp đó xuống qua Bảng điều khiển, Công cụ tìm kiếm có thể lập trình sẽ hợp nhất tất cả các tệp chú thích của bạn thành một tệp chú thích duy nhất. Các tệp chú thích mang đến sự linh hoạt để tuỳ chỉnh cùng một trang web cho nhiều công cụ tìm kiếm. Ví dụ: một công cụ tìm kiếm có thể giới hạn phạm vi tìm kiếm ở một số trang web, một công cụ khác có thể loại bỏ các trang web đó, và một công cụ khác có thể quảng bá các trang web đó.

context.xml

Sau đây là ví dụ về tệp context.xml chứa các nhãn xác định công cụ tìm kiếm mà tệp này sẽ áp dụng:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

Dưới đây là ví dụ về tệp chú thích cho thấy cách mỗi trang web (chú thích) liên kết với một nhãn:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Trở lại đầu trang

Tạo công cụ tìm kiếm nâng cao có thể lập trình

Quá trình tạo công cụ nâng cao bao gồm các bước sau:

  1. Xác định định dạng phù hợp với nhu cầu của bạn.
  2. Xác định đặc điểm kỹ thuật cho công cụ tìm kiếm của bạn.
  3. Cho Công cụ tìm kiếm có thể lập trình biết cần tìm trang web nào.
  4. Cho Công cụ tìm kiếm có thể lập trình biết cách xếp hạng các kết quả tìm kiếm.

Chỉnh sửa tệp của Công cụ tìm kiếm có thể lập trình

Để làm việc trên tệp XML, hãy tải thông số kỹ thuật XML xuống từ trang Tổng quan của Bảng điều khiển. Không bắt đầu tệp từ đầu. Hãy thực hiện như sau:

  1. Tải tệp ngữ cảnh hoặc tệp chú thích xuống từ trang Tổng quan của Bảng điều khiển. Nhấp vào nút Tải xuống trong phần Tính năng tìm kiếm.
  2. Sử dụng trình chỉnh sửa văn bản có thể xử lý các kết thúc dòng kiểu UNIX (WordPad, Emacs và TextMate hoạt động; NotePad thì không). Bạn đặt tên tệp không quan trọng, miễn là bạn lưu tệp bằng đuôi tệp .xml (ví dụ: cx_global.xml)
  3. Hãy tạo một bản sao lưu của tệp đã tải xuống phòng trường hợp phiên bản đã chỉnh sửa của bạn không hoạt động như mong đợi và bạn phải hoàn nguyên về phiên bản trước đó.

    Nếu bạn không tạo bản sao và phiên bản bạn đã chỉnh sửa không hoạt động đúng cách, bạn cần phải gỡ lỗi tệp hoặc tạo lại toàn bộ công cụ tìm kiếm. Không thú vị.

  4. Chỉnh sửa tệp XML rồi lưu. Đảm bảo rằng trình chỉnh sửa văn bản của bạn đang lưu tệp dưới dạng tài liệu văn bản Unicode và không phải là một số định dạng tệp khác.
  5. Tải tệp lên trong phần Tính năng tìm kiếm trên trang Tổng quan.

Chọn định dạng phù hợp

Trước khi bắt đầu tạo Công cụ tìm kiếm có thể lập trình, hãy xác định định dạng phù hợp nhất với nhu cầu của bạn. Bạn không muốn chọn một định dạng mạnh mẽ và phức tạp hơn so với nhu cầu của mình, cũng như không muốn sử dụng định dạng mà mình sẽ nhanh chóng phát triển nhanh chóng.

Hãy sử dụng bảng sau để chọn định dạng phù hợp.

Để tạo Sử dụng Các điểm hạn chế Thông tin khác
Một hoặc một vài công cụ tìm kiếm có ít trang web Bảng điều khiển Bạn có thể nhanh chóng tạo Công cụ tìm kiếm có thể lập trình bằng cách điền thông tin vào các hộp văn bản thay vì tạo tệp bằng trình chỉnh sửa văn bản rồi tải tệp lên. Bảng điều khiển chủ yếu giúp bạn làm quen với Công cụ tìm kiếm có thể lập trình và tạo công cụ tìm kiếm bằng ít trang web. Bắt đầu
Các công cụ tìm kiếm phức tạp sử dụng nhiều trang web, sử dụng nguồn cấp dữ liệu Tệp ngữ cảnh và tệp chú thích

Các tệp trên Công cụ tìm kiếm có thể lập trình giúp bạn kiểm soát tốt hơn các công cụ tìm kiếm, đồng thời thực hiện các nhiệm vụ xác định và quản lý trang web dễ dàng hơn rất nhiều.

Mặc dù bạn dự định tạo công cụ tìm kiếm bằng cách sử dụng các tệp ngữ cảnh và chú thích, bạn vẫn nên làm quen với Bảng điều khiển.

Bạn càng tuỳ chỉnh nhiều công cụ tìm kiếm thì công cụ càng trở nên phức tạp. Bạn phải học các phần tử và thuộc tính của Tìm kiếm có thể lập trình. Đây là những phần tử và thuộc tính không khó để chọn, nhưng bạn cần phải đầu tư thời gian.

Bạn sẽ phải đọc phần còn lại của hướng dẫn dành cho nhà phát triển. Rất tiếc, đây không phải là tài liệu thú vị nhất để đọc.

Ngữ cảnh: Xác định đặc tả công cụ tìm kiếmChú thích: Chọn trang web

Trở lại đầu trang