Trang này đề cập đến phiên bản XML của API Tìm kiếm tuỳ chỉnh JSON (chỉ dành cho khách hàng Google Site Search).
- Tổng quan
- Định dạng yêu cầu cho Công cụ tìm kiếm có thể lập trình
- Kết quả XML
Tổng quan
Dịch vụ Google WebSearch cho phép khách hàng của Google Site Search hiển thị kết quả tìm kiếm trên Google trên trang web của riêng họ. Dịch vụ WebSearch sử dụng một giao thức dựa trên HTTP đơn giản để phân phát kết quả tìm kiếm. Quản trị viên tìm kiếm có toàn quyền kiểm soát cách họ yêu cầu kết quả tìm kiếm và cách họ hiển thị các kết quả đó cho người dùng cuối. Tài liệu này mô tả thông tin kỹ thuật của các định dạng kết quả và yêu cầu tìm kiếm trên Google.
Để truy xuất kết quả trên Google WebSearch, ứng dụng của bạn sẽ gửi cho Google một yêu cầu HTTP đơn giản. Sau đó, Google sẽ trả về kết quả tìm kiếm ở định dạng XML. Kết quả có định dạng XML cho phép bạn tuỳ chỉnh cách hiển thị kết quả tìm kiếm.
Định dạng yêu cầu WebSearch
- Tổng quan về yêu cầu
- Thuật ngữ truy vấn
- Tham số cho yêu cầu
- Truy vấn WebSearch mẫu
- Định nghĩa tham số truy vấn WebSearch
- Truy vấn hình ảnh mẫu
- Định nghĩa tham số truy vấn tìm kiếm hình ảnh
- Tìm kiếm nâng cao
- Tham số truy vấn tìm kiếm nâng cao
- Điều khoản truy vấn đặc biệt
- Yêu cầu giới hạn
Tổng quan về yêu cầu
Yêu cầu tìm kiếm của Google là một lệnh HTTP GET
tiêu chuẩn. Mô-đun này
bao gồm một tập hợp các thông số có liên quan đến
truy vấn của bạn. Những thông số này được đưa vào URL yêu cầu dưới dạng các cặp tên=giá trị
được phân tách bằng các ký tự ký hiệu và (&). Các tham số này bao gồm các dữ liệu như cụm từ tìm kiếm và mã công cụ duy nhất (cx
) giúp xác định công cụ đang tạo yêu cầu HTTP. Dịch vụ WebSearch hoặc Tìm kiếm hình ảnh sẽ trả về kết quả XML theo các yêu cầu HTTP của bạn.
Cụm từ tìm kiếm
Hầu hết các yêu cầu tìm kiếm đều bao gồm một hoặc nhiều cụm từ tìm kiếm. Cụm từ truy vấn xuất hiện dưới dạng giá trị của một thông số trong yêu cầu tìm kiếm.
Cụm từ truy vấn có thể chỉ định một số loại thông tin để lọc và sắp xếp các kết quả tìm kiếm mà Google trả về. Truy vấn có thể chỉ định:
- Từ hoặc cụm từ cần bao gồm hoặc
loại trừ
- Tất cả các từ trong cụm từ tìm kiếm (mặc định)
- Một cụm từ chính xác trong cụm từ tìm kiếm
- Bất kỳ từ hoặc cụm từ nào trong cụm từ tìm kiếm
- Vị trí của cụm từ tìm kiếm trong tài liệu
- Bất cứ vị trí nào trong tài liệu (mặc định)
- Chỉ trong phần nội dung của tài liệu
- Chỉ trong tiêu đề tài liệu
- Chỉ trong URL của tài liệu
- Chỉ trong các đường liên kết trong tài liệu
- Quy định hạn chế đối với giấy tờ
- Bao gồm hoặc loại trừ tài liệu thuộc các loại tệp cụ thể (chẳng hạn như tệp PDF hoặc tài liệu Word)
- Truy vấn URL đặc biệt trả về thông tin về một URL nhất định thay vì thực hiện tìm kiếm
- Các truy vấn trả về thông tin chung về một URL, chẳng hạn như danh mục Thư mục mở, đoạn mã hoặc ngôn ngữ của URL đó
- Các truy vấn trả về tập hợp các trang web liên kết đến một URL
- Các truy vấn trả về một tập hợp các trang web tương tự với một URL nhất định
Tìm kiếm mặc định
Giá trị tham số truy vấn tìm kiếm phải là ký tự thoát URL. Xin lưu ý rằng bạn sẽ thay thế dấu cộng ("+") cho mọi chuỗi khoảng trắng trong cụm từ tìm kiếm. Nội dung này sẽ được thảo luận kỹ hơn trong phần Thoát URL của tài liệu này.
Cụm từ tìm kiếm được gửi đến dịch vụ WebSearch bằng tham số q. Ví dụ về cụm từ tìm kiếm:
q=horses+cows+pigs
Theo mặc định, dịch vụ Google WebSearch chỉ trả về những tài liệu có tất cả các cụm từ trong cụm từ tìm kiếm.
Tham số yêu cầu
Phần này liệt kê các tham số mà bạn có thể sử dụng khi tạo yêu cầu tìm kiếm. Các thông số được chia thành hai danh sách. Danh sách đầu tiên chứa các tham số liên quan đến tất cả yêu cầu tìm kiếm. Danh sách thứ hai chứa các tham số chỉ liên quan đến các yêu cầu tìm kiếm nâng cao.
Bắt buộc phải có 3 tham số yêu cầu:
- Bạn phải đặt thông số client thành
google-csbe
- Tham số đầu ra chỉ định định dạng của các kết quả XML được trả về; kết quả có thể được trả về kèm theo (xml) hoặc không kèm theo (
xml_no_dtd
) thông tin tham chiếu đến DTD của Google. Bạn nên đặt giá trị này thànhxml_no_dtd
. Lưu ý: Nếu bạn không chỉ định tham số này, thì kết quả sẽ được trả về ở định dạng HTML thay vì XML.
- Tham số cx biểu thị mã nhận dạng duy nhất của công cụ.
Ngoài các tham số nêu trên, các tham số yêu cầu thường dùng nhất là:
Truy vấn WebSearch mẫu
Các ví dụ dưới đây cho thấy một số yêu cầu HTTP của WebSearch để minh hoạ cách sử dụng các tham số truy vấn khác nhau. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn WebSearch và Tham số truy vấn tìm kiếm nâng cao của tài liệu này.
Yêu cầu này yêu cầu 10 kết quả đầu tiên (start=0&num=10
) cho cụm từ truy vấn "red sox" (q=red+sox
). Truy vấn này cũng chỉ định rằng kết quả phải đến từ các trang web của Canada (cr=countryCA
) và phải được viết bằng tiếng Pháp (lr=lang_fr
). Cuối cùng, truy vấn này chỉ định các giá trị cho tham số client, output và cx, cả ba giá trị này đều là bắt buộc.
http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
Ví dụ này sử dụng một số tham số truy vấn tìm kiếm nâng cao để tuỳ chỉnh thêm cụm từ tìm kiếm. Yêu cầu này sử dụng thông số as_q (as_q=red+sox
) thay vì thông số q. Phương thức này cũng sử dụng tham số as_eq để loại trừ bất kỳ tài liệu nào chứa từ "Yankees" khỏi kết quả tìm kiếm (as_eq=yankees
).
http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
Định nghĩa tham số truy vấn WebSearch
c2coff | |||||||
---|---|---|---|---|---|---|---|
Mô tả | Optional . Thông số c2coff sẽ bật hoặc tắt tính năng Tìm kiếm bằng tiếng Trung giản thể và phồn thể. Giá trị mặc định cho tham số này là
|
||||||
Ví dụ | q=google&c2coff=1 |
khách hàng | |
---|---|
Mô tả | Bắt buộc. Tham số |
Ví dụ | q=google&client=google-csbe |
cr | |
---|---|
Mô tả | Optional . Thông số Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:
Hãy xem phần Giá trị thông số Quốc gia (cr) để biết danh sách các giá trị hợp lệ cho thông số này. |
Ví dụ | q=Frodo&cr=countryNZ |
cx | |
---|---|
Mô tả | Bắt buộc. Tham số |
Ví dụ | q=Frodo&cx=00255077836266642015:u-scht7a-8i |
filter | |||||||
---|---|---|---|---|---|---|---|
Mô tả | Optional . Thông số filter kích hoạt hoặc tắt tính năng tự động lọc kết quả tìm kiếm của Google. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google. Giá trị mặc định cho tham số
Lưu ý: Theo mặc định, Google áp dụng chế độ lọc cho tất cả kết quả tìm kiếm để cải thiện chất lượng của những kết quả đó. |
||||||
Ví dụ | q=google&filter=0 |
gl | |
---|---|
Mô tả | Optional . Giá trị thông số Việc chỉ định giá trị tham số |
Ví dụ | Yêu cầu này giúp cải thiện các tài liệu viết bằng Vương quốc Anh trong
kết quả của WebSearch: |
hl | |
---|---|
Mô tả | Optional . Tham số Xem phần Ngôn ngữ giao diện trong bài Quốc tế hoá truy vấn và trình bày kết quả để biết thêm thông tin và xem Ngôn ngữ giao diện được hỗ trợ để biết danh sách các ngôn ngữ được hỗ trợ. |
Ví dụ | Yêu cầu này nhắm mục tiêu các quảng cáo về rượu vang bằng tiếng Pháp. (Vin là một thuật ngữ tiếng Pháp chỉ rượu vang.) q=vin&ip=10.10.10.10&ad=w5&hl=fr |
chất lượng cao | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ | Yêu cầu này tìm kiếm 'pizza' VÀ 'phô mai'. Biểu thức này giống với
|
ie | |
---|---|
Mô tả | Optional . Thông số Xem phần Mã hoá ký tự để thảo luận về thời điểm bạn có thể cần sử dụng thông số này. Xem phần Lược đồ mã hóa ký tự để biết danh sách các giá trị |
Ví dụ | q=google&ie=utf8&oe=utf8 |
lr | |
---|---|
Mô tả | Optional . Thông số Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:
Xem phần Giá trị tập hợp Ngôn ngữ ( |
Ví dụ | q=Frodo&lr=lang_en |
num | |
---|---|
Mô tả | Optional . Tham số Giá trị Lưu ý: Nếu tổng số kết quả tìm kiếm ít hơn số lượng kết quả yêu cầu, thì mọi kết quả tìm kiếm hiện có sẽ được trả về. |
Ví dụ | q=google&num=10 |
oe | |
---|---|
Mô tả | Optional . Thông số Xem phần Mã hoá ký tự để thảo luận về thời điểm bạn có thể cần sử dụng thông số này. Xem phần Lược đồ mã hóa ký tự để biết danh sách các giá trị |
Ví dụ | q=google&ie=utf8&oe=utf8 |
output | |||||||
---|---|---|---|---|---|---|---|
Mô tả | Bắt buộc. Tham số
|
||||||
Ví dụ | output=xml_no_dtd |
q | |
---|---|
Mô tả | Optional . Tham số Bạn cũng có thể dùng một số cụm từ truy vấn đặc biệt trong giá trị của tham số Bảng điều khiển của Google Tìm kiếm có một báo cáo về các cụm từ tìm kiếm hàng đầu được gửi bằng tham số Lưu ý: Giá trị chỉ định cho tham số q phải là ký tự thoát URL. |
Ví dụ | q=vacation&as_oq=london+paris |
an toàn | |||||||||
---|---|---|---|---|---|---|---|---|---|
Mô tả | Optional . Tham số
Vui lòng xem phần Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn để biết thêm thông tin chi tiết về tính năng này. |
||||||||
Ví dụ | q=adult&safe=high |
bắt đầu | |
---|---|
Mô tả | Optional . Tham số Tham số |
Ví dụ | start=10 |
sắp xếp | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ |
|
ud | |
---|---|
Mô tả | Optional . Tham số http://www.花井鮨.com Các giá trị hợp lệ cho tham số này là Nếu bạn đặt tham số http://www.xn--elq438j.com. Lưu ý: Đây là tính năng thử nghiệm. |
Ví dụ | q=google&ud=1 |
Tìm kiếm nâng cao
Các tham số truy vấn bổ sung được liệt kê bên dưới hình ảnh có liên quan đến các truy vấn tìm kiếm nâng cao. Khi bạn gửi nội dung tìm kiếm nâng cao, giá trị của một số tham số (ví dụ: as_eq, as_epq, as_oq, v.v.) đều được đưa vào cụm từ tìm kiếm cho nội dung tìm kiếm đó. Hình ảnh thể hiện trang Tìm kiếm nâng cao của Google. Trên hình ảnh, tên của từng thông số tìm kiếm nâng cao được viết bằng văn bản red bên trong hoặc bên cạnh trường trên trang tương ứng với tham số đó.
Tham số truy vấn tìm kiếm nâng cao
as_dt | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ | as_dt=i,as_dt=e |
as_epq | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ | as_epq=abraham+lincoln |
as_eq | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ |
|
as_lq | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ |
|
as_nlo | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ | Công cụ sau đây đặt phạm vi tìm kiếm từ 5 đến 10:
|
as_nhi | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ | Công cụ sau đây đặt phạm vi tìm kiếm từ 5 đến 10:
|
as_oq | |
---|---|
Mô tả | Optional . Thông số |
Ví dụ |
|
as_q | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ |
|
as_qdr | |
---|---|
Mô tả | Optional . Tham số
|
Ví dụ |
Ví dụ sau yêu cầu kết quả từ năm trước:
Ví dụ sau đây yêu cầu kết quả từ 10 ngày qua:
|
as_sitesearch | |
---|---|
Mô tả | Optional . Tham số |
Ví dụ |
|
Cụm từ truy vấn đặc biệt
Google WebSearch cho phép sử dụng một số cụm từ truy vấn đặc biệt để truy cập các tính năng bổ sung của công cụ tìm kiếm của Google. Bạn nên đưa các thuật ngữ truy vấn đặc biệt này vào giá trị của tham số yêu cầu q. Giống như các cụm từ truy vấn khác, các cụm từ truy vấn đặc biệt phải là ký tự thoát URL. Một số cụm từ truy vấn đặc biệt có chứa dấu hai chấm (:). Ký tự này cũng phải là ký tự thoát URL; giá trị thoát trong URL của ký tự này là %3A
.
Đường liên kết ngược [link:] | |
---|---|
Mô tả | Cụm từ truy vấn Phiên bản thoát trong URL của Bạn cũng có thể sử dụng tham số yêu cầu as_lq để gửi yêu cầu Lưu ý: Bạn không thể chỉ định bất kỳ thuật ngữ truy vấn nào khác khi sử dụng |
Ví dụ |
|
Boolean HOẶC Tìm kiếm [ OR ] | |
---|---|
Mô tả | Cụm từ truy vấn Bạn cũng có thể sử dụng tham số yêu cầu as_oq để gửi nội dung tìm kiếm cho bất kỳ cụm từ nào trong một nhóm cụm từ. Lưu ý: Nếu một yêu cầu tìm kiếm chỉ định cụm từ "London+OR+Paris", thì kết quả tìm kiếm sẽ bao gồm các tài liệu chứa ít nhất một trong hai từ đó. Trong một số trường hợp, tài liệu trong kết quả tìm kiếm có thể chứa cả hai từ. |
Ví dụ | Tìm London hoặc Paris: Dữ liệu do người dùng nhập:
london OR
paris Cụm từ truy vấn:q=london+OR+paris Tìm kỳ nghỉ ở London hoặc Paris: Cụm từ truy vấn:
q=vacation+london+OR+paris Tìm kỳ nghỉ và một trong các thành phố London, Paris hoặc sô cô la: Cụm từ truy vấn:
q=vacation+london+OR+paris+OR+chocolates Tìm sô cô la và kỳ nghỉ, hay london hoặc paris, với trọng lượng cho sô cô la thấp nhất: Cụm từ truy vấn:
q=vacation+london+OR+paris+chocolates Tìm kiếm kỳ nghỉ, sô cô la và hoa trong các tài liệu cũng có chứa thông tin về London hoặc Paris: Cụm từ truy vấn:
q=vacation+london+OR+paris+chocolates+flowers Tìm kỳ nghỉ và một trong các thành phố London hoặc Paris, đồng thời tìm kiếm một trong các loại sô cô la hoặc hoa: Cụm từ truy vấn: q=vacation+london+OR+paris+chocolates+OR+flowers |
Loại trừ cụm từ truy vấn [-] | |
---|---|
Mô tả | Cụm từ truy vấn loại trừ ( Phiên bản thoát trong URL của Cụm từ tìm kiếm loại trừ sẽ hữu ích khi một cụm từ tìm kiếm có nhiều ý nghĩa. Ví dụ: từ "bass" có thể trả về các kết quả về cá hoặc nhạc. Nếu đang tìm tài liệu về cá, bạn có thể loại trừ các tài liệu về âm nhạc khỏi kết quả tìm kiếm bằng cách sử dụng cụm từ tìm kiếm loại trừ. Bạn cũng có thể sử dụng tham số yêu cầu as_eq để loại trừ các tài liệu khớp với một từ hoặc cụm từ cụ thể khỏi kết quả tìm kiếm. |
Ví dụ | Dữ liệu do người dùng nhập: bass -music Cụm từ truy vấn: q=bass+%2Dmusic |
Loại trừ loại tệp [ -filetype: ] | |
---|---|
Mô tả | Cụm từ truy vấn Phiên bản thoát trong URL của Lưu ý: Bạn có thể loại trừ nhiều loại tệp khỏi kết quả tìm kiếm bằng cách thêm các cụm từ truy vấn Các loại tệp được Google hỗ trợ bao gồm:
Các loại tệp khác có thể được thêm trong tương lai. Bạn luôn có thể tìm thấy danh sách mới nhất trong phần Câu hỏi thường gặp về loại tệp của Google. |
Ví dụ | Ví dụ này trả về các tài liệu đề cập đến "Google" nhưng
không phải là tài liệu PDF: Ví dụ này trả về các tài liệu có nhắc đến "Google" nhưng loại trừ cả tài liệu PDF và Word: |
Lọc loại tệp [ loại tệp: ] | |
---|---|
Mô tả | Cụm từ tìm kiếm Phiên bản thoát trong URL của Bạn có thể giới hạn kết quả tìm kiếm ở những tài liệu khớp với một trong nhiều đuôi tệp bằng cách thêm các cụm từ tìm kiếm Theo mặc định, kết quả tìm kiếm sẽ bao gồm các tài liệu có đuôi tệp bất kỳ. Các loại tệp được Google hỗ trợ bao gồm:
Các loại tệp khác có thể được thêm trong tương lai. Bạn luôn có thể tìm thấy danh sách mới nhất trong phần Câu hỏi thường gặp về loại tệp của Google. |
Ví dụ | Ví dụ này trả về các tài liệu PDF đề cập đến "Google": Ví dụ này trả về các tài liệu PDF và Word đề cập đến "Google": |
Bao gồm cụm từ truy vấn [+] | |
---|---|
Mô tả | Cụm từ truy vấn include (+) chỉ định rằng một từ hoặc cụm từ phải xuất hiện trong tất cả các tài liệu có trong kết quả tìm kiếm. Để sử dụng cụm từ tìm kiếm, bạn phải mở đầu từ hoặc cụm từ cần có trong mọi kết quả tìm kiếm bằng dấu "+". Phiên bản thoát trong URL của Bạn nên dùng |
Ví dụ | Dữ liệu do người dùng nhập: Star Wars Episode +I Cụm từ truy vấn: q=Star+Wars+Episode+%2BI |
Chỉ liên kết Tìm kiếm, tất cả cụm từ [ allinlinks: ] | |
---|---|
Mô tả | Cụm từ tìm kiếm Nếu cụm từ tìm kiếm của bạn chứa cụm từ tìm kiếm Phiên bản thoát trong URL của |
Ví dụ | Dữ liệu do người dùng nhập:allinlinks: Google search Cụm từ truy vấn: q=allinlinks%3A+Google+search |
Tìm kiếm theo cụm từ | |
---|---|
Mô tả | Cụm từ tìm kiếm theo cụm từ (") cho phép bạn tìm kiếm các cụm từ hoàn chỉnh bằng cách đặt các cụm từ trong dấu ngoặc kép hoặc kết nối chúng bằng dấu gạch nối. Phiên bản thoát trong URL của Tính năng tìm kiếm theo cụm từ đặc biệt hữu ích khi bạn tìm những câu trích dẫn nổi tiếng hoặc tên riêng. Bạn cũng có thể dùng tham số yêu cầu as_epq để gửi nội dung tìm kiếm theo cụm từ. |
Ví dụ | Dữ liệu do người dùng nhập:"Abraham Lincoln" Cụm từ truy vấn: q=%22Abraham+Lincoln%22 |
Chỉ tìm kiếm văn bản, tất cả cụm từ [allintext:] | |
---|---|
Mô tả | Cụm từ truy vấn Nếu cụm từ tìm kiếm của bạn có chứa cụm từ tìm kiếm Phiên bản thoát trong URL của |
Ví dụ | Ví dụ này chỉ định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong phần nội dung của tất cả các tài liệu có trong kết quả tìm kiếm: Dữ liệu do người dùng nhập: allintext:Google search Cụm từ truy vấn: q=allintext%3AGoogle+search |
Tìm kiếm theo tiêu đề, một từ [intitle:] | |
---|---|
Mô tả | Cụm từ truy vấn Lưu ý: Bạn có thể chỉ định nhiều từ cần phải có trong tiêu đề tài liệu bằng cách đặt cụm từ truy vấn Phiên bản thoát trong URL của |
Ví dụ | Ví dụ này quy định rằng từ "Google" phải xuất hiện trong tiêu đề của mọi tài liệu trong kết quả tìm kiếm và từ "tìm kiếm" phải xuất hiện ở bất kỳ vị trí nào trong tiêu đề, URL, đường liên kết hoặc nội dung của những tài liệu đó: |
Tìm kiếm theo tiêu đề, tất cả các cụm từ [allintitle:] | |
---|---|
Mô tả | Cụm từ tìm kiếm Lưu ý: Việc đặt Phiên bản thoát URL của |
Ví dụ | Ví dụ này quy định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong tiêu đề của mọi tài liệu trong kết quả tìm kiếm: |
Tìm kiếm URL, một từ khóa [inurl:] | |
---|---|
Mô tả | Cụm từ tìm kiếm Cụm từ truy vấn Phiên bản thoát trong URL của |
Ví dụ | Ví dụ này quy định rằng từ "Google" phải xuất hiện trong URL của mọi tài liệu trong kết quả tìm kiếm và từ "tìm kiếm" phải xuất hiện ở bất kỳ vị trí nào trong tiêu đề, URL, đường liên kết hoặc nội dung của những tài liệu đó: |
Tìm kiếm URL, tất cả cụm từ [allinurl:] | |
---|---|
Mô tả | Cụm từ tìm kiếm Cụm từ truy vấn Phiên bản thoát trong URL của |
Ví dụ | Ví dụ này xác định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong URL của mọi tài liệu trong kết quả tìm kiếm: |
Thông tin tài liệu web [thông tin:] | |
---|---|
Mô tả | Cụm từ tìm kiếm Phiên bản thoát URL của Lưu ý: Bạn không thể chỉ định bất kỳ thuật ngữ truy vấn nào khác khi sử dụng |
Ví dụ | Dữ liệu do người dùng nhập: info:www.google.com Cụm từ truy vấn: q=info%3Awww.google.com |
Truy vấn hình ảnh mẫu
Các ví dụ bên dưới hiển thị một số yêu cầu HTTP hình ảnh để minh họa cách sử dụng các tham số truy vấn khác nhau. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn hình ảnh của tài liệu này.
Yêu cầu này yêu cầu 5 kết quả đầu tiên (start=0&num=5
) cho cụm từ truy vấn "khỉ" (q=monkey
), thuộc loại tệp .png. Cuối cùng, truy vấn này chỉ định các giá trị cho các tham số client
, output
và cx
, cả ba giá trị này đều là bắt buộc.
http://www.google.com/cse? searchtype=image start=0 &num=5 &q=monkey &as_filetype=png &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
Tham số truy vấn tìm kiếm hình ảnh
as_filetype | |
---|---|
Mô tả | Optional . Trả về hình ảnh thuộc một loại đã chỉ định. Các giá trị được phép là: |
Ví dụ | q=google&as_filetype=png |
ảnh imgsz | |
---|---|
Mô tả | Optional . Trả về hình ảnh có kích thước được chỉ định, trong đó kích thước có thể là một trong các kích thước sau:
|
Ví dụ | q=google&as_filetype=png&imgsz=icon |
loại hình ảnh | |
---|---|
Mô tả | Optional . Trả về hình ảnh của một loại, có thể là một trong các loại sau:
|
Ví dụ | q=google&as_filetype=png&imgtype=photo |
hình ảnh | |
---|---|
Mô tả | Optional . Trả về hình ảnh đen trắng, thang màu xám hoặc hình ảnh màu:
|
Ví dụ | q=google&as_filetype=png&imgc=gray |
màu img | |
---|---|
Mô tả | Optional . Trả về hình ảnh của một màu chủ đạo cụ thể:
|
Ví dụ | q=google&as_filetype=png&imgcolor=yellow |
as_rights | |
---|---|
Mô tả | Optional . Bộ lọc dựa trên việc cấp phép. Sau đây là các giá trị được hỗ trợ:
|
Ví dụ | q=cats&as_filetype=png&as_rights=cc_attribute |
Giới hạn yêu cầu
Biểu đồ dưới đây liệt kê các giới hạn đối với các yêu cầu tìm kiếm mà bạn gửi tới Google:
Thành phần | Hạn mức | Bình luận |
---|---|---|
Thời lượng yêu cầu tìm kiếm | 2048 byte | |
Số lượng từ khoá truy vấn | 10 | bao gồm các cụm từ trong tham số sau: q, as_epq, as_eq, as_lq, as_oq, as_q |
Số kết quả | 20 | Nếu bạn đặt tham số num thành một số lớn hơn 20, thì hệ thống chỉ trả về 20 kết quả. Để nhận được nhiều kết quả hơn, bạn cần gửi nhiều yêu cầu và tăng giá trị của thông số start với mỗi yêu cầu. |
Quốc tế hoá truy vấn và trình bày kết quả
Dịch vụ Google WebSearch cho phép bạn tìm kiếm tài liệu bằng nhiều ngôn ngữ. Bạn có thể chỉ định phương thức mã hoá ký tự sẽ dùng để diễn giải yêu cầu HTTP và mã hoá phản hồi XML (bằng cách sử dụng các tham số tìm kiếm ie và oe). Bạn cũng có thể lọc kết quả để chỉ bao gồm tài liệu viết bằng một số ngôn ngữ.
Những phần sau đây thảo luận các vấn đề liên quan đến việc tìm kiếm bằng nhiều ngôn ngữ:
Mã hoá ký tự
Máy chủ gửi dữ liệu (chẳng hạn như các trang web) cho tác nhân người dùng (chẳng hạn như trình duyệt) dưới dạng một chuỗi các byte được mã hoá. Sau đó, tác nhân người dùng sẽ giải mã byte thành một chuỗi ký tự. Khi gửi yêu cầu đến dịch vụ WebSearch, bạn có thể chỉ định các giao thức mã hoá cho cả cụm từ tìm kiếm và phản hồi XML mà bạn nhận được.
Bạn có thể sử dụng tham số yêu cầu ie để chỉ định cơ chế mã hoá cho các ký tự trong yêu cầu HTTP. Bạn cũng có thể sử dụng tham số oe để chỉ định lược đồ mã hoá mà Google nên sử dụng để mã hoá phản hồi XML của bạn. Nếu bạn đang sử dụng lược đồ mã hoá khác ISO-8859-1
(hoặc latin1
), hãy đảm bảo rằng bạn chỉ định giá trị chính xác cho các thông số ie và oe.
Lưu ý: Nếu đang cung cấp chức năng tìm kiếm cho nhiều ngôn ngữ, bạn nên sử dụng giá trị mã hoá utf8
(UTF-8) cho cả tham số ie và oe.
Vui lòng tham khảo phụ lục về Lược đồ mã hoá ký tự để biết danh sách đầy đủ các giá trị mà bạn có thể sử dụng cho thông số ie và oe.
Để biết thêm thông tin chung về chế độ mã hoá ký tự, vui lòng xem http://www.w3.org/TR/REC-html40/charset.html.
Ngôn ngữ giao diện
Bạn có thể sử dụng tham số yêu cầu hl để xác định ngôn ngữ của giao diện đồ hoạ của mình. Giá trị tham số hl có thể ảnh hưởng đến kết quả tìm kiếm XML, đặc biệt là đối với các cụm từ tìm kiếm quốc tế khi bạn không chỉ định rõ ràng quy định hạn chế về ngôn ngữ (sử dụng thông số lr). Trong những trường hợp như vậy, thông số hl có thể quảng bá kết quả tìm kiếm bằng chính ngôn ngữ mà người dùng nhập.
Bạn nên thiết lập rõ ràng thông số hl trong kết quả tìm kiếm để đảm bảo Google chọn các kết quả tìm kiếm có chất lượng cao nhất cho mỗi cụm từ tìm kiếm.
Vui lòng xem phần Ngôn ngữ giao diện được hỗ trợ để biết danh sách đầy đủ các giá trị hợp lệ cho thông số hl.
Tìm kiếm tài liệu bằng ngôn ngữ cụ thể
Bạn có thể sử dụng thông số yêu cầu lr để giới hạn kết quả tìm kiếm ở các tài liệu được viết bằng một ngôn ngữ hoặc một nhóm ngôn ngữ cụ thể.
Thông số lr hỗ trợ Toán tử Boolean để cho phép bạn chỉ định nhiều ngôn ngữ cần đưa vào (hoặc loại trừ) khỏi kết quả tìm kiếm.
Các ví dụ sau đây cho thấy cách bạn có thể sử dụng Toán tử Boolean để yêu cầu tài liệu bằng nhiều ngôn ngữ.
Đối với tài liệu viết bằng tiếng Nhật:
lr=lang_jp
Đối với tài liệu viết bằng tiếng Ý hoặc tiếng Đức:
lr=lang_it|lang_de
Đối với tài liệu không được viết bằng tiếng Hungary hoặc tiếng Séc:
lr=(-lang_hu).(-lang_cs)
Vui lòng xem phần Giá trị tập hợp ngôn ngữ để biết danh sách đầy đủ các giá trị có thể sử dụng cho thông số lr và phần Toán tử Boolean để thảo luận đầy đủ về việc sử dụng các toán tử này.
Tìm kiếm tiếng Trung Giản thể và Phồn thể
Tiếng Trung giản thể và tiếng Trung phồn thể là hai biến thể chữ viết của tiếng Trung. Một khái niệm tương tự có thể được viết theo cách khác nhau tuỳ theo biến thể. Khi cung cấp một truy vấn thuộc một trong hai biến thể, dịch vụ Google WebSearch có thể trả về kết quả chứa các trang thuộc cả hai biến thể.
Để sử dụng tính năng này:
- Đặt tham số yêu cầu c2coff thành 0
và - Thực hiện một trong những thao tác sau:
Ví dụ sau đây cho thấy các tham số truy vấn mà bạn sẽ đưa vào một yêu cầu cho kết quả bằng cả tiếng Trung giản thể và phồn thể. (Xin lưu ý rằng ví dụ này không bao gồm thông tin bắt buộc bổ sung, chẳng hạn như ứng dụng.)
search?hl=zh-CN &lr=lang_zh-TW|lang_zh-CN &c2coff=0
Lọc kết quả
Google WebSearch cung cấp một số cách để lọc kết quả tìm kiếm của bạn:
- Tự động lọc kết quả tìm kiếm
- Lọc ngôn ngữ và quốc gia
- Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
Tự động lọc kết quả tìm kiếm
Nhằm nỗ lực cung cấp kết quả tìm kiếm tốt nhất có thể, Google dùng hai kỹ thuật để tự động lọc bỏ những kết quả tìm kiếm thường bị coi là không mong muốn:
-
Nội dung trùng lặp – Nếu nhiều tài liệu chứa thông tin giống nhau, thì chỉ tài liệu có liên quan nhất trong nhóm đó mới được đưa vào kết quả tìm kiếm của bạn.
-
Chèn chồng lên máy chủ – Nếu có nhiều kết quả tìm kiếm trên cùng một trang web, có thể Google sẽ không cho thấy mọi kết quả trên trang web đó hoặc có thể đưa ra những kết quả có thứ hạng thấp hơn trong
thứ hạng so với trước đây.
Bạn nên bật những bộ lọc này đối với các yêu cầu tìm kiếm thông thường vì những bộ lọc này giúp cải thiện đáng kể chất lượng của hầu hết kết quả tìm kiếm. Tuy nhiên, bạn có thể bỏ qua các bộ lọc tự động này bằng cách đặt tham số truy vấn filter thành 0 trong yêu cầu tìm kiếm.
Lọc ngôn ngữ và quốc gia
Dịch vụ Google WebSearch trả về kết quả từ một chỉ mục chính của mọi tài liệu trên web. Chỉ mục chính chứa các tập hợp con gồm các tài liệu được nhóm theo những thuộc tính cụ thể, trong đó có ngôn ngữ và quốc gia xuất xứ.
Bạn có thể sử dụng các tham số yêu cầu lr và cr để giới hạn kết quả tìm kiếm trong các tập hợp con của tài liệu được viết bằng các ngôn ngữ cụ thể hoặc có nguồn gốc tương ứng từ các quốc gia cụ thể.
Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:
- miền cấp cao nhất (TLD) trong URL của tài liệu
- thẻ meta ngôn ngữ trong tài liệu
- ngôn ngữ chính được dùng trong phần nội dung của tài liệu
Ngoài ra, vui lòng xem định nghĩa của thông số lr, phần trong mục Tìm kiếm tài liệu viết bằng ngôn ngữ cụ thể và Giá trị của bộ sưu tập ngôn ngữ có thể dùng làm giá trị cho thông số lr để biết thêm thông tin về cách hạn chế kết quả theo ngôn ngữ.
Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:
- miền cấp cao nhất (TLD) trong URL của tài liệu
- vị trí địa lý của địa chỉ IP của máy chủ Web
Ngoài ra, vui lòng xem định nghĩa của thông số cr và Giá trị thu thập quốc gia có thể dùng làm giá trị cho thông số cr để biết thêm thông tin về việc hạn chế kết quả theo quốc gia xuất xứ.
Lưu ý: Bạn có thể kết hợp giá trị ngôn ngữ và giá trị quốc gia để tuỳ chỉnh kết quả tìm kiếm. Ví dụ: bạn có thể yêu cầu giấy tờ được viết bằng tiếng Pháp và có nguồn gốc từ Pháp hoặc Canada, hoặc bạn có thể yêu cầu giấy tờ có nguồn gốc từ Hà Lan mà không phải bằng tiếng Anh. Các thông số lr và cr đều hỗ trợ Toán tử Boolean.
Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
Nhiều khách hàng của Google không muốn cho thấy kết quả tìm kiếm cho các trang web có chứa nội dung người lớn. Khi sử dụng bộ lọc Tìm kiếm an toàn của chúng tôi, bạn có thể sàng lọc kết quả tìm kiếm có chứa nội dung người lớn và loại bỏ những kết quả đó. Các bộ lọc của Google sử dụng công nghệ độc quyền để kiểm tra từ khoá, cụm từ và URL. Mặc dù không có bộ lọc nào chính xác 100% nhưng tính năng Tìm kiếm an toàn sẽ loại bỏ phần lớn nội dung người lớn khỏi kết quả tìm kiếm của bạn.
Google cố gắng cung cấp tính năng Tìm kiếm an toàn theo cách mới nhất và toàn diện nhất có thể bằng cách liên tục thu thập dữ liệu trên web và kết hợp nội dung cập nhật từ nội dung đề xuất của người dùng.
Tính năng Tìm kiếm an toàn hỗ trợ các ngôn ngữ sau:
Tiếng Hà Lan Tiếng Anh Tiếng Pháp Tiếng Đức |
Tiếng Ý Tiếng Bồ Đào Nha (Brazil) Tiếng Tây Ban Nha Tiếng Trung phồn thể |
Bạn có thể điều chỉnh mức độ mà Google lọc kết quả về nội dung người lớn bằng cách sử dụng tham số truy vấn an toàn. Bảng sau đây giải thích chế độ cài đặt tính năng Tìm kiếm an toàn của Google và ảnh hưởng của các chế độ cài đặt đó đến kết quả tìm kiếm:
Mức độ Tìm kiếm an toàn | Nội dung mô tả |
---|---|
cao | Bật phiên bản tìm kiếm an toàn nghiêm ngặt hơn. |
trung bình | Chặn các trang web có chứa nội dung khiêu dâm và nội dung khiêu dâm khác. |
đang tắt | Không lọc nội dung người lớn khỏi kết quả tìm kiếm. |
* Chế độ cài đặt Tìm kiếm an toàn mặc định bị tắt.
Nếu bạn đã bật tính năng Tìm kiếm an toàn và bạn tìm thấy các trang web chứa nội dung phản cảm trong kết quả tìm kiếm, vui lòng gửi email URL của trang web đó đến địa chỉ safesearch@google.com để chúng tôi tiến hành điều tra trang web đó.
Kết quả XML
- Kết quả XML của Google DTD
- Giới thiệu về Phản hồi XML
- Kết quả XML cho cụm từ tìm kiếm thông thường và nâng cao
- Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML
- Tìm kiếm thông thường/nâng cao: Thẻ XML
Kết quả XML của Google DTD
Google sử dụng cùng một DTD để mô tả định dạng XML cho mọi loại kết quả tìm kiếm. Nhiều thẻ và thuộc tính có thể áp dụng cho mọi loại tìm kiếm. Tuy nhiên, một số thẻ chỉ áp dụng cho một số loại tìm kiếm nhất định. Do đó, các định nghĩa trong DTD có thể ít hạn chế hơn so với các định nghĩa được đưa ra trong tài liệu này.
Tài liệu này mô tả các khía cạnh của DTD có liên quan đến WebSearch. Khi xem DTD, nếu đang xử lý WebSearch, bạn có thể yên tâm bỏ qua các thẻ và thuộc tính chưa được nêu ở đây. Nếu định nghĩa giữa DTD và tài liệu khác nhau, thì thông tin đó sẽ được lưu ý trong tài liệu này.
Google có thể trả về kết quả XML có hoặc không tham chiếu đến DTD gần đây nhất. DTD là hướng dẫn giúp các quản trị viên tìm kiếm và trình phân tích cú pháp XML hiểu được kết quả XML của Google. Vì ngữ pháp XML của Google có thể thay đổi tuỳ từng thời điểm, nên bạn không nên định cấu hình trình phân tích cú pháp nhằm sử dụng DTD để xác thực từng kết quả XML.
Ngoài ra, bạn không nên định cấu hình trình phân tích cú pháp XML để tìm nạp DTD mỗi khi bạn gửi yêu cầu tìm kiếm. Google không cập nhật DTD thường xuyên và những yêu cầu này làm phát sinh các yêu cầu về độ trễ và băng thông không cần thiết.
Bạn nên sử dụng định dạng đầu ra xml_no_dtd để nhận kết quả XML. Nếu bạn chỉ định định dạng xml đầu ra trong yêu cầu tìm kiếm, điểm khác biệt duy nhất là việc thêm dòng sau vào kết quả XML:
<!DOCTYPE GSP SYSTEM "google.dtd">
Bạn có thể truy cập DTD mới nhất tại http://www.google.com/google.dtd.
Xin lưu ý rằng không phải tất cả các tính năng trong DTD đều có thể sử dụng hoặc được hỗ trợ vào thời điểm này.
Giới thiệu về Phản hồi XML
- Tất cả các giá trị phần tử đều là HTML hợp lệ và phù hợp để hiển thị trừ phi có ghi chú khác trong định nghĩa thẻ XML.
- Một số giá trị của phần tử là các URL cần được mã hoá HTML trước khi hiển thị.
- Trình phân tích cú pháp XML của bạn nên bỏ qua các thuộc tính và thẻ không được ghi lại. Điều này cho phép ứng dụng của bạn tiếp tục hoạt động mà không cần sửa đổi nếu Google thêm các tính năng khác vào kết quả XML.
- Một số ký tự phải được thoát khi đưa vào dưới dạng giá trị trong thẻ XML. Trình xử lý XML của bạn phải chuyển đổi các thực thể này về các ký tự thích hợp. Ví dụ: nếu bạn không chuyển đổi các thực thể đúng cách, trình duyệt có thể hiển thị ký tự & dưới dạng "&".
Tiêu chuẩn XML ghi lại các ký tự này; những ký tự này được sao chép trong bảng dưới đây:
Ký tự Biểu mẫu thoát Thực thể Mã ký tự Ký hiệu & và & & Dấu nháy đơn ' ' ' Dấu nháy kép " " " Dấu lớn hơn > > > Dấu nhỏ hơn < < <
Kết quả XML cho cụm từ tìm kiếm thông thường và nâng cao
Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML
Yêu cầu WebSearch mẫu này yêu cầu 10 kết quả (num=10
) về cụm từ tìm kiếm "socer" (q=socer
), tức là từ "soccer" có chủ đích bị đánh vần sai trong ví dụ này.)
http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i
Yêu cầu này cho ra kết quả XML dưới đây. Xin lưu ý rằng kết quả XML có một số nhận xét để cho biết vị trí một số thẻ nhất định không có trong kết quả xuất hiện.
<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>
Tìm kiếm thông thường/nâng cao: Thẻ XML
Các phản hồi XML cho cả yêu cầu tìm kiếm thông thường và yêu cầu tìm kiếm nâng cao đều sử dụng cùng một bộ thẻ XML. Các thẻ XML này được thể hiện trong ví dụ XML ở trên và được giải thích trong các bảng dưới đây.
Các thẻ XML dưới đây được liệt kê theo thứ tự bảng chữ cái của tên thẻ và mỗi định nghĩa thẻ đều chứa nội dung mô tả về thẻ, ví dụ cho thấy cách thẻ sẽ xuất hiện trong kết quả XML và định dạng của nội dung thẻ. Nếu thẻ đó là thẻ phụ của một thẻ XML khác hoặc nếu thẻ đó có thẻ phụ hoặc thuộc tính riêng, thì thông tin đó cũng được cung cấp trong bảng định nghĩa của thẻ.
Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:
* = 0 hoặc nhiều lần xuất hiện của thẻ phụ
+ = một hoặc nhiều lần xuất hiện của thẻ phụ
A | B | C | D | Khắc phục | G | C | Người | T | M | N | P | Hỏi | R | CN | T | U | X |
anchor_text | |
---|---|
Định nghĩa | Thẻ <anchor_text> chỉ định văn bản mà bạn nên hiển thị cho người dùng để xác định nhãn tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm. Vì các nhãn tinh lọc thay thế các ký tự không phải chữ và số bằng dấu gạch dưới, nên bạn không nên hiển thị giá trị của thẻ <label> trong giao diện người dùng. Thay vào đó, bạn nên hiển thị giá trị của thẻ <anchor_text>. |
Ví dụ | <anchor_text>Sân gôn</anchor_text> |
Thẻ phụ của | FacetItem |
Định dạng nội dung | Văn bản |
CHẶN | |
---|---|
Định nghĩa | Thẻ này bao gồm nội dung của khối trong dòng nội dung của kết quả khuyến mãi. Mỗi khối có các thẻ phụ T, U và L. Thẻ T không trống biểu thị khối có chứa văn bản; thẻ U và L không trống biểu thị khối có chứa một liên kết (với URL được cung cấp trong thẻ phụ U và văn bản liên kết trong thẻ phụ L). |
Thẻ phụ | T, U, L |
Thẻ phụ của | BODY_LINE |
Định dạng nội dung | Trống |
BODY_LINE | |
---|---|
Định nghĩa | Thẻ này bao gồm nội dung của một dòng trong phần nội dung của kết quả được quảng cáo. Mỗi dòng nội dung bao gồm một số thẻ BLOCK, trong đó chứa một số văn bản hoặc một đường liên kết có URL và văn bản liên kết. |
Thẻ phụ | CHẶN* |
Thẻ phụ của | SL_MAIN |
Định dạng nội dung | Trống |
C | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <C> cho biết rằng dịch vụ WebSearch có thể truy xuất phiên bản đã lưu trong bộ nhớ đệm của URL kết quả tìm kiếm này. Bạn không thể truy xuất các trang đã lưu vào bộ nhớ đệm thông qua XML API, nhưng có thể chuyển hướng người dùng đến www.google.com đối với nội dung này. |
|||||||||
Thuộc tính |
|
|||||||||
Ví dụ | <C SZ="6k" CID="kvOXK_cYSSgJ" /> | |||||||||
Thẻ phụ của | HAS | |||||||||
Định dạng nội dung | Trống |
C2C (C2C) | |
---|---|
Định nghĩa | Thẻ <C2C> cho biết rằng kết quả đề cập đến một trang tiếng Trung phồn thể. Thẻ này chỉ xuất hiện khi bạn bật Tìm kiếm bằng tiếng Trung giản thể và phồn thể. Hãy xem định nghĩa về tham số truy vấn c2coff để biết thêm thông tin về cách bật và tắt tính năng này. |
Định dạng nội dung | Văn bản |
Bối cảnh | |
---|---|
Định nghĩa | Thẻ <Context> đóng gói danh sách các nhãn tinh lọc được liên kết với một nhóm kết quả tìm kiếm. |
Ví dụ | <Context> |
Thẻ phụ | title, Khía cạnh+ |
Định dạng nội dung | Vùng chứa |
Hàm CRAWLDATE | |
---|---|
Định nghĩa | Thẻ <CRAWLDATE> xác định ngày mà trang được thu thập dữ liệu lần gần đây nhất. |
Ví dụ | <CRAWLDATE>Ngày 21 tháng 5, 2005</CRAWLDATE> |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản |
DI (Di chuyển) | |
---|---|
Định nghĩa | Thẻ <DI> đóng gói thông tin danh mục Dự án thư mục mở (ODP) cho một kết quả tìm kiếm. |
Ví dụ | <DI> |
Thẻ phụ | DT?, DS? |
Thẻ phụ của | HAS |
Định dạng nội dung | Trống |
DS | |
---|---|
Định nghĩa | Thẻ <DS> cung cấp bản tóm tắt được liệt kê cho một danh mục duy nhất trong thư mục ODP. |
Ví dụ | <DS>Đăng <b>soccer</b> trực tiếp lên Internet.</DS> |
Thẻ phụ của | DI |
Định dạng nội dung | Văn bản (có thể chứa HTML) |
DT (cây thiết bị) | |
---|---|
Định nghĩa | Thẻ <DT> cung cấp tiêu đề cho một danh mục được liệt kê trong thư mục ODP. |
Ví dụ | <DT>FootballConnection.net</DT> |
Thẻ phụ của | DI |
Định dạng nội dung | Văn bản (có thể chứa HTML) |
Thuộc tính | |
---|---|
Định nghĩa | Thẻ <Facet> chứa một nhóm các thẻ <FacetItem> theo logic. Bạn có thể tạo các nhóm này bằng định dạng Thông số kỹ thuật XML của Công cụ tìm kiếm có thể lập trình. Nếu bạn không tạo các nhóm này, thẻ results_xml_tag_Context><Context> sẽ chứa tối đa 4 thẻ <Facet>. Các mục trong mỗi thẻ <Facet> sẽ được nhóm để hiển thị nhưng có thể không có mối quan hệ logic. |
Ví dụ | <Facet> |
Thẻ phụ | FacetItem+, title+ |
Thẻ phụ của | Bối cảnh |
Định dạng nội dung | Vùng chứa |
FacetItem | |
---|---|
Định nghĩa | Thẻ <FacetItem> đóng gói thông tin về nhãn tinh lọc được liên kết với một tập hợp kết quả tìm kiếm. |
Ví dụ | <FacetItem> |
Thẻ phụ | label, anchor_text+ |
Thẻ phụ của | Khía cạnh |
Định dạng nội dung | FacetItem |
FI | |
---|---|
Định nghĩa | Thẻ <FI> đóng vai trò là cờ cho biết liệu quá trình lọc tài liệu có được thực hiện cho lượt tìm kiếm hay không. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google. |
Ví dụ | <FI /> |
Thẻ phụ của | Tái bảo vệ quyền riêng tư |
Định dạng nội dung | Trống |
GSP | |||||||
---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <GSP> đóng gói tất cả dữ liệu được trả về trong kết quả tìm kiếm XML của Google. "GSP" là tên viết tắt của "Google Search Protocol" (Giao thức tìm kiếm của Google). |
||||||
Thuộc tính |
|
||||||
Ví dụ | <GSP VER="3.2"> | ||||||
Thẻ phụ | PARAM+, Q, RES?, TM | ||||||
Định dạng nội dung | Trống |
HAS | |
---|---|
Định nghĩa | Thẻ <HAS> đóng gói thông tin về bất kỳ tham số của yêu cầu tìm kiếm đặc biệt nào được hỗ trợ cho một URL cụ thể.
Lưu ý: Định nghĩa của <HAS> cho WebSearch hạn chế hơn so với trong DTD. |
Thẻ phụ | DI?, L?, C?, RT? |
Thẻ phụ của | R |
Hàm ISURL | |
---|---|
Định nghĩa | Google sẽ trả về thẻ <ISURL> nếu cụm từ tìm kiếm được liên kết là một URL. |
Thẻ phụ của | GSP |
Định dạng nội dung | Trống |
L | |
---|---|
Định nghĩa | Nếu có thẻ <L>, thì dịch vụ WebSearch có thể tìm thấy những trang web khác liên kết đến URL của kết quả tìm kiếm này. Để tìm thấy các trang web như vậy, bạn sẽ sử dụng cụm từ truy vấn đặc biệt link:. |
Thẻ phụ của | HAS |
Định dạng nội dung | Trống |
label | |
---|---|
Định nghĩa | Thẻ <label> chỉ định một nhãn tinh lọc mà bạn có thể dùng để lọc kết quả tìm kiếm mình nhận được. Để sử dụng nhãn tinh lọc, hãy thêm chuỗi more:[[label tag value]] vào giá trị của thông số q trong yêu cầu HTTP của bạn cho Google như trong ví dụ sau. Xin lưu ý rằng giá trị này phải là ký tự thoát URL trước khi bạn gửi truy vấn đến Google. This example uses the refinement label golf_courses to Lưu ý: Thẻ <label> không giống với thẻ <Label>, giúp xác định nhãn tinh lọc được liên kết với một URL cụ thể trong kết quả tìm kiếm của bạn. |
Ví dụ | <label>golf_courses</label> |
Thẻ phụ của | FacetItem |
Định dạng nội dung | Văn bản |
TIẾNG VIỆT | |
---|---|
Định nghĩa | Thẻ <LANG> chứa gợi ý tốt nhất của Google về ngôn ngữ của kết quả tìm kiếm. |
Ví dụ | <LANG>en</LANG> |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản |
M | |
---|---|
Định nghĩa | Thẻ <M> xác định tổng số kết quả ước tính cho tìm kiếm. Lưu ý: Số liệu ước tính này có thể không chính xác. |
Ví dụ | <M>16200000</M> |
Thẻ phụ của | Tái bảo vệ quyền riêng tư |
Định dạng nội dung | Văn bản |
Sơ sinh | |
---|---|
Định nghĩa | Thẻ <NB> đóng gói thông tin điều hướng — đường liên kết đến trang tiếp theo của kết quả tìm kiếm hoặc trang trước đó của kết quả tìm kiếm — cho nhóm kết quả. Lưu ý: Thẻ này chỉ xuất hiện nếu có thêm kết quả. |
Ví dụ | <NB> |
Thẻ phụ | NU?, PU? |
Thẻ phụ của | Tái bảo vệ quyền riêng tư |
Định dạng nội dung | Trống |
NU (Bắc, Trung và Nam Mỹ) | |
---|---|
Định nghĩa | Thẻ <NU> chứa đường liên kết tương đối đến trang tiếp theo của kết quả tìm kiếm. |
Ví dụ | <NU>/search?q=flowers&num=10&hl=vi&ie=UTF-8 &output=xml&client=test&start=10</NU> |
Thẻ phụ của | Lưu ý: |
Định dạng nội dung | Văn bản (URL tương đối) |
THÔNG TIN | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <PARAM> xác định tham số đầu vào được gửi trong yêu cầu HTTP được liên kết với kết quả XML. Thông tin về thông số có trong các thuộc tính thẻ – tên, giá trị, giá trị gốc – và sẽ có một thẻ PARAM cho mỗi thông số được gửi trong yêu cầu HTTP. |
||||||||||||
Thuộc tính |
|
||||||||||||
Ví dụ | <PARAM name="cr" value="countryNZ" native_value="countryNZ" /> | ||||||||||||
Thẻ phụ của | GSP | ||||||||||||
Định dạng nội dung | Phức tạp |
PU | |
---|---|
Định nghĩa | Thẻ <PU> cung cấp đường liên kết tương đối đến trang trước của kết quả tìm kiếm. |
Ví dụ | <PU>/search?q=flowers&num=10&hl=vi&output=xml &client=test&start=10</PU> |
Thẻ phụ của | Lưu ý: |
Định dạng nội dung | Văn bản (URL tương đối) |
Hỏi | |
---|---|
Định nghĩa | Thẻ <Q> xác định cụm từ tìm kiếm được gửi trong yêu cầu HTTP liên kết với kết quả XML đó. |
Ví dụ | <Q>pizza</Q> |
Thẻ phụ của | GSP |
Định dạng nội dung | Văn bản |
R | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <R> đóng gói thông tin chi tiết về từng kết quả tìm kiếm. Lưu ý: Định nghĩa của thẻ <R> cho WebSearch hạn chế hơn so với trong DTD. |
|||||||||
Thuộc tính |
|
|||||||||
Thẻ phụ | U, UE, T?, CRAWLDATE, S?, TIẾNG VIỆT?, HAS | |||||||||
Thẻ phụ của | Tái bảo vệ quyền riêng tư |
Trở lại | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <RES> đóng gói tập hợp kết quả tìm kiếm riêng lẻ và thông tin chi tiết về các kết quả đó. |
|||||||||
Thuộc tính |
|
|||||||||
Ví dụ | <RES SN="1" EN="10"> | |||||||||
Thẻ phụ | T, FI?, XT?, NB?, R* | |||||||||
Thẻ phụ của | GSP | |||||||||
Định dạng nội dung | Trống |
S | |
---|---|
Định nghĩa | Thẻ <S> chứa phần trích dẫn cho kết quả tìm kiếm hiển thị các cụm từ truy vấn được in đậm. Dấu ngắt dòng được đưa vào phần trích dẫn để xuống dòng tự động cho phù hợp. |
Ví dụ | <S> Washington (CNN) – Một nỗ lực nhằm chấm dứt tình trạng bế tắc ở Thượng viện đối với Tổng thống Bush |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản (HTML) |
SL_MAIN | |
---|---|
Định nghĩa | Thẻ này bao gồm nội dung của kết quả khuyến mãi. Sử dụng để phân tích cú pháp kết quả được thăng hạng. Văn bản liên kết và URL của đường liên kết tiêu đề lần lượt nằm trong thẻ phụ T và U. Các dòng của văn bản nội dung và đường liên kết nằm trong thẻ phụ BODY_LINE. |
Thẻ phụ | BODY_LINE*, T, U |
Thẻ phụ của | SL_RESULTS |
Định dạng nội dung | Trống |
SL_RESULTS | |
---|---|
Định nghĩa | Thẻ vùng chứa cho kết quả được quảng bá. Một trong những thông tin này sẽ xuất hiện bất cứ khi nào bạn có chương trình khuyến mãi trong kết quả tìm kiếm. Thẻ phụ SL_MAIN chứa dữ liệu kết quả chính. |
Thẻ phụ | SL_MAIN* |
Thẻ phụ của | R |
Định dạng nội dung | Trống |
Chính tả | |
---|---|
Định nghĩa | Thẻ <Spelling> đóng gói một đề xuất chính tả thay thế cho truy vấn được gửi. Thẻ này chỉ xuất hiện trên trang đầu tiên của kết quả tìm kiếm. Tính năng đề xuất chính tả có bằng tiếng Anh, tiếng Trung, tiếng Nhật và tiếng Hàn. Lưu ý: Google sẽ chỉ trả về các đề xuất chính tả cho những cụm từ tìm kiếm có giá trị thông số gl được viết bằng chữ thường. |
Ví dụ | <Spelling> |
Thẻ phụ | Đề xuất |
Thẻ phụ của | GSP |
Định dạng nội dung | Trống |
Đề xuất | |||||||
---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <suggestionsion> chứa một mục đề xuất chính tả thay thế cho cụm từ tìm kiếm được gửi. Bạn có thể sử dụng nội dung của thẻ để đề xuất cách viết khác cho người dùng tìm kiếm. Giá trị của thuộc tính q là đề xuất chính tả thoát khỏi URL mà bạn có thể sử dụng làm cụm từ truy vấn. | ||||||
Thuộc tính |
|
||||||
Ví dụ | <Đề xuất q="soccer"><b><i>soccer</i></b></Đề xuất> | ||||||
Thẻ phụ của | Chính tả | ||||||
Định dạng nội dung | Văn bản (HTML) |
T | |
---|---|
Định nghĩa | Thẻ <T> chứa tiêu đề của kết quả. |
Ví dụ | <T>Bờ biển Đông của Amici</T> |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản (HTML) |
tiêu đề | |
---|---|
Định nghĩa | Là phần tử con của <Context>, thẻ <title> chứa tên của Công cụ tìm kiếm có thể lập trình. Là phần tử con của <Facet>, thẻ <title> cung cấp tiêu đề cho một tập hợp các thuộc tính. |
Ví dụ | Là phần tử con của <Context>: <title>My Search Engine</title> Là phần tử con của <Facet>: <title>facet title</title> |
Thẻ phụ của | Ngữ cảnh, Khía cạnh |
Định dạng nội dung | Văn bản |
TM | |
---|---|
Định nghĩa | Thẻ <TM> xác định tổng thời gian máy chủ cần thiết để trả về kết quả tìm kiếm, tính bằng giây. |
Ví dụ | <TM>0,100445</TM> |
Thẻ phụ của | GSP |
Định dạng nội dung | Văn bản (Số dấu phẩy động) |
TT | |
---|---|
Định nghĩa | Thẻ <TT> cung cấp mẹo tìm kiếm. |
Ví dụ | <TT><i>Mẹo: Đối với hầu hết các trình duyệt, việc nhấn phím Quay lại sẽ tạo ra các kết quả tương tự như khi nhấp vào nút Tìm kiếm.</i></TT> |
Thẻ phụ của | GSP |
U | |
---|---|
Định nghĩa | Thẻ <U> cung cấp URL của kết quả tìm kiếm. |
Ví dụ | <U>http://www.dominos.com/</U> |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản (URL tuyệt đối) |
UD (Ukraina) | |
---|---|
Định nghĩa | Thẻ <UD> cung cấp URL được mã hoá IDN (Tên miền quốc tế) cho kết quả tìm kiếm. Giá trị này cho phép hiển thị miền bằng ngôn ngữ địa phương. Ví dụ: URL được mã hoá bằng IDN http://www.%E8%8A%B1%E4%BA%95.com có thể được giải mã và hiển thị dưới dạng http://www.花鮨.com. Thẻ <UD> này sẽ chỉ được đưa vào kết quả tìm kiếm cho những yêu cầu chứa tham số ud. Lưu ý: Đây là tính năng thử nghiệm. |
Ví dụ | <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD> |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản (URL được mã hoá IDN) |
UE | |
---|---|
Định nghĩa | Thẻ <UE> cung cấp URL của kết quả tìm kiếm. Giá trị này được thoát URL để phù hợp để truyền dưới dạng tham số truy vấn trong URL. |
Ví dụ | <UE>http://www.dominos.com/</UE> |
Thẻ phụ của | R |
Định dạng nội dung | Văn bản (URL thoát khỏi URL) |
XT | |
---|---|
Định nghĩa | Thẻ <XT> cho biết tổng số kết quả ước tính do thẻ M chỉ định trên thực tế biểu thị tổng số kết quả chính xác. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin chi tiết. |
Ví dụ | <XT /> |
Thẻ phụ của | Tái bảo vệ quyền riêng tư |
Định dạng nội dung | Trống |
Kết quả XML cho cụm từ tìm kiếm hình ảnh
Yêu cầu Hình ảnh mẫu này yêu cầu 5 kết quả (num=5) về cụm từ tìm kiếm "khỉ" (q=k).
http://www.google.com/cse? searchtype=image &num=2 &q=monkey &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
Yêu cầu này cho ra kết quả XML dưới đây.
<GSP VER="3.2"> <TM>0.395037</TM> <Q>monkeys</Q> <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/> <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/> <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/> <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/> <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/> <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/> <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/> <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/> <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/> <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/> <Context> <title>domestigeek</title> </Context> <ARES/> <RES SN="1" EN="2"> <M>2500000</M> <NB> <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N </NU> </NB> <RG START="1" SIZE="2"/> <R N="1" MIME="image/jpeg"> <RU>http://www.flickr.com/photos/fncll/135465558/</RU> <U> http://farm1.static.flickr.com/46/135465558_123402af8c.jpg </U> <UE> http://farm1.static.flickr.com/46/135465558_123402af8c.jpg </UE> <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T> <RK>0</RK> <BYLINEDATE>1146034800</BYLINEDATE> <S>Computer <b>Monkeys</b> | Flickr</S> <LANG>en</LANG> <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"> <SZ>88386</SZ> <IN/> </IMG> <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi- t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/> </R> <R N="2" MIME="image/jpeg"> <RU> http://www.flickr.com/photos/flickerbulb/187044366/ </RU> <U> http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg </U> <UE> http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg </UE> <T> one. ugly. <b>monkey</b>. | Flickr - Photo Sharing! </T> <RK>0</RK> <BYLINEDATE>1152514800</BYLINEDATE> <S>one. ugly. <b>monkey</b>.</S> <LANG>en</LANG> <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw- EF4tQQnDDKOq0"><SZ>58339</SZ> <IN/> </IMG> <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/> </R> </RES> </GSP>
Tìm kiếm hình ảnh: Thẻ XML
Bảng dưới đây trình bày các thẻ XML khác được dùng trong phản hồi XML cho các cụm từ tìm kiếm hình ảnh.
Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:
* = 0 hoặc nhiều lần xuất hiện của thẻ phụ
+ = một hoặc nhiều lần xuất hiện của thẻ phụ
RG (Bulgaria) | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Định nghĩa | Thẻ <RG> cung cấp thông tin chi tiết về kết quả tìm kiếm hình ảnh riêng lẻ. |
|||||||||
Thuộc tính |
| |||||||||
Thẻ phụ của | Tái bảo vệ quyền riêng tư |
RU (Nga) | |
---|---|
Định nghĩa | Thẻ <RU tag> chứa thông tin chi tiết của từng kết quả tìm kiếm hình ảnh. |
Thẻ phụ của | R |