Trang này giới thiệu các khái niệm cơ bản của tệp cấu hình của Công cụ tìm kiếm có thể lập trình.
- Tổng quan
- Có gì trong một Công cụ tìm kiếm có thể lập trình
- Cách các thành phần hoạt động cùng nhau
- Tạo công cụ tìm kiếm
- Chỉnh sửa tệp trên Công cụ tìm kiếm có thể lập trình
- Chọn định dạng phù hợp
Tổng quan
Nếu Bảng điều khiển không cho phép bạn tuỳ chỉnh theo mức độ mà bạn cần, hãy cân nhắc việc sử dụng định dạng XML của Công cụ tìm kiếm có thể lập trình. Định dạng này giúp bạn có nhiều quyền kiểm soát hơn, linh hoạt hơn và truy cập vào các tính năng mạnh mẽ hơn.
Để sử dụng các tệp cấu hình của Công cụ tìm kiếm có thể lập trình, hãy bắt đầu bằng cách tạo một công cụ tìm kiếm cơ bản sử dụng Bảng điều khiển của Công cụ tìm kiếm có thể lập trình. Sau khi tạo công cụ tìm kiếm, bạn có thể tải các tệp XML ngữ cảnh và chú thích xuống từ trang Tổng quan của Bảng điều khiển.
Khái niệm cơ bản về XML
Ngôn ngữ đánh dấu mở rộng hay XML là một ngôn ngữ đánh dấu đa năng. Đó là văn bản có các thẻ mà bạn có thể đọc. Ví dụ: định dạng XML của Công cụ tìm kiếm có thể lập trình bao gồm các thẻ sau: <Context> </Context>
và <LookAndFeel> </LookAndFeel>
.
Giống như mọi tệp XML, thông số kỹ thuật của Công cụ tìm kiếm có thể lập trình phải tuân theo cú pháp XML (<element attribute="value">content</element>
) và phải được định dạng đúng cách. XML có các quy tắc sau:
- XML yêu cầu bạn khai báo XML (
<?xml version="1.0"?>
) trước các thẻ cấp cao nhất, nhưng tệp cấu hình của Công cụ tìm kiếm có thể lập trình không yêu cầu tệp này. - Tất cả các phần tử của bạn phải có thẻ mở (
<tag>
) và thẻ đóng (</tag>
). - Tất cả thẻ của bạn phải được lồng đúng cách. Bạn không thể có mã XML giống như:
<sandwich><filling> peanut butter</sandwich></filling>
. Thay vào đó, mã sẽ có dạng như:<sandwich><filling> peanut butter</filling></sandwich>
. - XML có phân biệt chữ hoa chữ thường, vì vậy, hãy cẩn thận tuân theo cách viết hoa và chính tả của thẻ trong hướng dẫn.
- Bạn phải đặt tất cả các giá trị thuộc tính trong dấu ngoặc kép (
<element attribute="value">
). - Bạn phải xác định tất cả thuộc tính trong thẻ mở (
<element attribute="value">
), không phải trong thẻ đóng (</element>
).
Bạn có thể tự viết ghi chú bằng cách sử dụng thẻ nhận xét (<!-- your comment here -->
) và Công cụ tìm kiếm có thể lập trình sẽ không phân tích cú pháp dòng văn bản đó dưới dạng mã XML. Ngoài việc viết lời nhắc hoặc nội dung mô tả, bạn có thể dùng phần ghi chú để tạm thời không dùng được mã XML (có lẽ vì bạn muốn thử nghiệm một số hiệu ứng nhất định hoặc muốn khắc phục sự cố). Tuy nhiên, những nhận xét này không được lưu giữ trong các tệp mà bạn tải xuống từ Bảng điều khiển. Nếu muốn giữ lại nhận xét, bạn nên giữ bản sao của các tệp XML đã nhận xét ngay cả sau khi bạn tải chúng lên Bảng điều khiển.
Bạn có thể sử dụng một trình chỉnh sửa văn bản đơn giản để tạo và chỉnh sửa các tệp XML. Bạn chỉ cần lưu tệp văn bản có đuôi tệp là .xml
(ví dụ: cse_badminton.xml
).
Nội dung của một Công cụ tìm kiếm có thể lập trình
Công cụ tìm kiếm có thể lập trình có hai thành phần chính, mỗi thành phần do một tệp XML kiểm soát:
- Ngữ cảnh: Tệp XML ngữ cảnh mô tả các tính năng cơ bản của một công cụ tìm kiếm. Nó chỉ định các cài đặt chung của công cụ tìm kiếm, chẳng hạn như tính năng Tìm kiếm hình ảnh hoặc kết quả được thăng hạng có được bật hay không. Mỗi công cụ tìm kiếm đều có tệp ngữ cảnh riêng. Thông tin khác về tệp XML ngữ cảnh. Để biết thêm thông tin về cách chọn định dạng tệp phù hợp nhất cho công cụ tìm kiếm của bạn, hãy xem Chọn định dạng phù hợp cho công cụ tìm kiếm của bạn.
- Chú thích: Tệp XML chú thích liệt kê các trang hoặc trang web bạn muốn công cụ tìm kiếm xử lý và cho biết bất kỳ lựa chọn ưu tiên nào của bạn về cách xếp hạng các trang web này trong kết quả tìm kiếm. Mỗi trang web và thông tin liên quan của trang web đó được gọi là một chú thích. Thông tin khác về tệp XML của chú thích.
Bạn không nên tạo một trong hai tệp này từ đầu. Thay vào đó, hãy tải chúng xuống từ trang Overview (Tổng quan) của Bảng điều khiển.
Ngoài các thành phần chính này, một công cụ tìm kiếm cũng có thể có các tệp phụ trợ sau:
- Khuyến mãi: Tệp XML chương trình khuyến mãi liệt kê một loạt kết quả tuỳ chỉnh được kích hoạt bằng một tập hợp cụm từ truy vấn định sẵn. Khi người dùng nhập tìm kiếm khớp chính xác với một trong những cụm từ truy vấn của bạn, quảng cáo sẽ xuất hiện ở đầu trang. Bạn có thể sử dụng quảng cáo để trực tiếp trả lời truy vấn của người dùng, dẫn họ đến thông tin quan trọng hoặc hướng họ đến các trang web không nằm ở đầu trang kết quả nhưng lại đặc biệt có liên quan. Trong Bảng điều khiển, chương trình khuyến mãi được xác định trong thẻ Khuyến mãi. Thông tin khác về chương trình khuyến mãi.
- Từ đồng nghĩa: Tệp XML từ đồng nghĩa mở rộng cụm từ tìm kiếm của người dùng để bao gồm các biến thể của cụm từ tìm kiếm. Ví dụ: nếu người dùng của bạn tìm kiếm "simian" công cụ tìm kiếm cũng tìm kiếm "khỉ" và "vượn". Trong Bảng điều khiển, các từ đồng nghĩa được định nghĩa trong tab Từ đồng nghĩa. Thông tin khác về các từ đồng nghĩa.
Cách các thành phần hoạt động cùng nhau
Tệp XML ngữ cảnh không chỉ định tệp chú thích cần sử dụng và XML chú thích không tham chiếu đến tệp ngữ cảnh. Công cụ tìm kiếm có thể lập trình sử dụng nhãn để liên kết ngữ cảnh và chú thích. Tệp XML ngữ cảnh bao gồm các nhãn xác định công cụ tìm kiếm và mỗi chú thích được liệt kê trong XML chú thích được gắn thẻ với một hoặc nhiều nhãn nhận dạng(các) công cụ tìm kiếm chứa công cụ đó.Nếu bạn thay đổi tên của nhãn trong tệp ngữ cảnh, bạn phải thay đổi tất cả chú thích đã được gắn thẻ với nhãn đó.
Mặc dù bạn có thể tải nhiều tệp chú thích lên, nhưng khi bạn tải các tệp này xuống thông qua Bảng điều khiển, Công cụ tìm kiếm có thể lập trình sẽ hợp nhất tất cả các tệp chú thích của bạn vào một tệp chú thích duy nhất. Các tệp chú thích mang lại sự linh hoạt để tuỳ chỉnh cùng một trang web cho các công cụ tìm kiếm khác nhau. Ví dụ: một công cụ tìm kiếm có thể hạn chế tìm kiếm của nó đối với một số trang web, một công cụ tìm kiếm khác có thể loại bỏ các trang web đó, và một công cụ khác có thể quảng bá các trang web này.
context.xml
Sau đây là ví dụ về tệp ngữ cảnh.xml chứa các nhãn xác định công cụ tìm kiếm được áp dụng:
<BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> <BackgroundLabels>
annotations.xml
Dưới đây là ví dụ về tệp chú thích cho thấy cách mỗi trang web (chú thích) được liên kết với nhãn:
<Annotation about="code.google.com/*" score="1"> <Label name="_include_"/> </Annotation>
Tạo Công cụ tìm kiếm có thể lập trình nâng cao
Quy trình tạo công cụ nâng cao bao gồm các bước sau:
- Xác định định dạng phù hợp với nhu cầu của bạn.
- Xác định thông số kỹ thuật cho công cụ tìm kiếm.
- Cho Công cụ tìm kiếm có thể lập trình biết trang web nào cần tìm kiếm.
- Cho Công cụ tìm kiếm có thể lập trình biết cách xếp hạng kết quả tìm kiếm.
Chỉnh sửa tệp Công cụ tìm kiếm có thể lập trình
Để làm việc trên tệp XML, hãy tải xuống thông số kỹ thuật XML từ trang Tổng quan của Bảng điều khiển. Không tạo tệp từ đầu. Hãy thực hiện như sau:
- Tải tệp ngữ cảnh hoặc tệp chú thích xuống từ trang Tổng quan của Bảng điều khiển. Nhấp vào nút Tải xuống trong phần Tính năng tìm kiếm.
- Sử dụng trình chỉnh sửa văn bản có thể xử lý phần cuối dòng theo kiểu UNIX (WordPad, Emacs và TextMate hoạt động còn NotePad thì không). Việc bạn đặt tên tệp là gì không quan trọng, miễn là bạn lưu tệp ở đuôi tệp
.xml
(ví dụ:cx_global.xml
) - Tạo một bản sao dự phòng của tệp đã tải xuống phòng trường hợp phiên bản bạn đã chỉnh sửa không hoạt động như mong đợi và bạn phải hoàn nguyên về phiên bản trước đó.
Nếu bạn không tạo bản sao và phiên bản bạn đã chỉnh sửa không hoạt động bình thường, bạn cần phải gỡ lỗi tệp hoặc tạo lại công cụ tìm kiếm của mình. Không thú vị.
- Chỉnh sửa tệp XML và lưu tệp đó. Đảm bảo rằng trình soạn thảo văn bản của bạn đang lưu tệp dưới dạng tài liệu văn bản Unicode chứ không phải một số định dạng tệp khác.
- Tải tệp lên trong phần Tính năng tìm kiếm trên trang Tổng quan.
Chọn định dạng phù hợp
Trước khi bắt đầu tạo Công cụ tìm kiếm có thể lập trình, hãy xác định định dạng phù hợp nhất với nhu cầu của bạn. Bạn không muốn chọn một định dạng mạnh mẽ và phức tạp hơn những gì bạn cần, cũng như không muốn sử dụng một định dạng mà bạn sẽ nhanh chóng phát triển.
Hãy sử dụng bảng sau đây để chọn định dạng thích hợp.
Để tạo | Sử dụng | Bởi vì | Các điểm hạn chế | Thông tin khác |
---|---|---|---|---|
Một hoặc một vài công cụ tìm kiếm với số lượng trang web nhỏ | Bảng điều khiển | Bạn có thể nhanh chóng tạo Công cụ tìm kiếm có thể lập trình bằng cách điền vào các hộp văn bản thay vì tạo tệp bằng trình chỉnh sửa văn bản và tải tệp lên. | Bảng điều khiển chủ yếu rất hữu ích khi bạn muốn tự làm quen với Công cụ tìm kiếm có thể lập trình và tạo các công cụ tìm kiếm với ít trang web. | Bắt đầu |
Các công cụ tìm kiếm phức tạp sử dụng rất nhiều trang web, lại dùng nguồn cấp dữ liệu | Tệp ngữ cảnh và tệp chú thích | Các tệp trên Công cụ tìm kiếm có thể lập trình mang đến cho bạn khả năng kiểm soát chặt chẽ hơn đối với các công cụ tìm kiếm của mình, đồng thời giúp các nhiệm vụ xác định và quản lý trang web trở nên dễ dàng hơn nhiều. Mặc dù bạn dự định tạo công cụ tìm kiếm bằng cách sử dụng các tệp ngữ cảnh và chú thích, bạn vẫn nên làm quen với Bảng điều khiển. |
Bạn tuỳ chỉnh công cụ tìm kiếm càng nhiều thì công cụ tìm kiếm đó càng trở nên phức tạp. Bạn phải tìm hiểu các Phần tử và thuộc tính của Công cụ tìm kiếm có thể lập trình. Đây không phải là một cách thức khó, nhưng bạn sẽ phải đầu tư thời gian.
Thật không may, bạn sẽ phải đọc phần còn lại của hướng dẫn cho nhà phát triển. Rất tiếc, đây không phải là tài liệu đọc thú vị nhất. |
Ngữ cảnh: Xác định thông số kỹ thuật của công cụ tìm kiếm và Chú thích: Chọn trang web |