Tài liệu tham khảo API XML

Trang này đề cập đến phiên bản XML của API Tìm kiếm tuỳ chỉnh JSON (chỉ dành cho khách hàng Google Site Search).

  1. Tổng quan
  2. Định dạng yêu cầu cho Công cụ tìm kiếm có thể lập trình
    1. Yêu cầu tổng quan
    2. Thuật ngữ truy vấn
    3. Tham số cho yêu cầu
      1. Truy vấn WebSearch mẫu
      2. Định nghĩa tham số truy vấn WebSearch
      3. Tìm kiếm nâng cao
      4. Tham số truy vấn tìm kiếm nâng cao
      5. Điều khoản truy vấn đặc biệt
      6. Truy vấn hình ảnh mẫu
      7. Tham số truy vấn tìm kiếm hình ảnh
      8. Yêu cầu giới hạn
    4. Quốc tế hoá nội dung tìm kiếm và trình bày kết quả
      1. Mã hoá ký tự
      2. Ngôn ngữ giao diện
      3. Tìm kiếm bằng tiếng Trung giản thể và phồn thể
    5. Lọc kết quả
      1. Tự động lọc kết quả tìm kiếm
      2. Lọc ngôn ngữ và quốc gia
      3. Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn
  3. Kết quả XML
    1. Kết quả XML của Google DTD
    2. Giới thiệu về Phản hồi XML
    3. Kết quả XML cho các cụm từ tìm kiếm thông thường, hình ảnh và tìm kiếm nâng cao
      1. Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML
      2. Tìm kiếm thông thường/nâng cao: Thẻ XML
      3. Kết quả XML cho cụm từ tìm kiếm hình ảnh
      4. Tìm kiếm hình ảnh: Truy vấn mẫu và kết quả XML
      5. Tìm kiếm hình ảnh: Thẻ XML

Tổng quan

Dịch vụ Google WebSearch cho phép khách hàng của Google Site Search hiển thị kết quả tìm kiếm trên Google trên trang web của riêng họ. Dịch vụ WebSearch sử dụng một giao thức dựa trên HTTP đơn giản để phân phát kết quả tìm kiếm. Quản trị viên tìm kiếm có toàn quyền kiểm soát cách họ yêu cầu kết quả tìm kiếm và cách họ hiển thị các kết quả đó cho người dùng cuối. Tài liệu này mô tả thông tin kỹ thuật của các định dạng kết quả và yêu cầu tìm kiếm trên Google.

Để truy xuất kết quả trên Google WebSearch, ứng dụng của bạn sẽ gửi cho Google một yêu cầu HTTP đơn giản. Sau đó, Google sẽ trả về kết quả tìm kiếm ở định dạng XML. Kết quả có định dạng XML cho phép bạn tuỳ chỉnh cách hiển thị kết quả tìm kiếm.

Định dạng yêu cầu WebSearch

Tổng quan về yêu cầu

Yêu cầu tìm kiếm của Google là một lệnh HTTP GET tiêu chuẩn. Mô-đun này bao gồm một tập hợp các thông số có liên quan đến truy vấn của bạn. Những thông số này được đưa vào URL yêu cầu dưới dạng các cặp tên=giá trị được phân tách bằng các ký tự ký hiệu và (&). Các tham số này bao gồm các dữ liệu như cụm từ tìm kiếm và mã công cụ duy nhất (cx) giúp xác định công cụ đang tạo yêu cầu HTTP. Dịch vụ WebSearch hoặc Tìm kiếm hình ảnh sẽ trả về kết quả XML theo các yêu cầu HTTP của bạn.

Cụm từ tìm kiếm

Hầu hết các yêu cầu tìm kiếm đều bao gồm một hoặc nhiều cụm từ tìm kiếm. Cụm từ truy vấn xuất hiện dưới dạng giá trị của một thông số trong yêu cầu tìm kiếm.

Cụm từ truy vấn có thể chỉ định một số loại thông tin để lọc và sắp xếp các kết quả tìm kiếm mà Google trả về. Truy vấn có thể chỉ định:

  • Từ hoặc cụm từ cần bao gồm hoặc loại trừ
    • Tất cả các từ trong cụm từ tìm kiếm (mặc định)
    • Một cụm từ chính xác trong cụm từ tìm kiếm
    • Bất kỳ từ hoặc cụm từ nào trong cụm từ tìm kiếm
  • Vị trí của cụm từ tìm kiếm trong tài liệu
    • Bất cứ vị trí nào trong tài liệu (mặc định)
    • Chỉ trong phần nội dung của tài liệu
    • Chỉ trong tiêu đề tài liệu
    • Chỉ trong URL của tài liệu
    • Chỉ trong các đường liên kết trong tài liệu
  • Quy định hạn chế đối với giấy tờ
    • Bao gồm hoặc loại trừ tài liệu thuộc các loại tệp cụ thể (chẳng hạn như tệp PDF hoặc tài liệu Word)
  • Truy vấn URL đặc biệt trả về thông tin về một URL nhất định thay vì thực hiện tìm kiếm
    • Các truy vấn trả về thông tin chung về một URL, chẳng hạn như danh mục Thư mục mở, đoạn mã hoặc ngôn ngữ của URL đó
    • Các truy vấn trả về tập hợp các trang web liên kết đến một URL
    • Các truy vấn trả về một tập hợp các trang web tương tự với một URL nhất định

Tìm kiếm mặc định

Giá trị tham số truy vấn tìm kiếm phải là ký tự thoát URL. Xin lưu ý rằng bạn sẽ thay thế dấu cộng ("+") cho mọi chuỗi khoảng trắng trong cụm từ tìm kiếm. Nội dung này sẽ được thảo luận kỹ hơn trong phần Thoát URL của tài liệu này.

Cụm từ tìm kiếm được gửi đến dịch vụ WebSearch bằng tham số q. Ví dụ về cụm từ tìm kiếm:

q=horses+cows+pigs

Theo mặc định, dịch vụ Google WebSearch chỉ trả về những tài liệu có tất cả các cụm từ trong cụm từ tìm kiếm.

Tham số yêu cầu

Phần này liệt kê các tham số mà bạn có thể sử dụng khi tạo yêu cầu tìm kiếm. Các thông số được chia thành hai danh sách. Danh sách đầu tiên chứa các tham số liên quan đến tất cả yêu cầu tìm kiếm. Danh sách thứ hai chứa các tham số chỉ liên quan đến các yêu cầu tìm kiếm nâng cao.

Bắt buộc phải có 3 tham số yêu cầu:

  • Bạn phải đặt thông số client thành google-csbe
  • Tham số đầu ra chỉ định định dạng của các kết quả XML được trả về; kết quả có thể được trả về kèm theo (xml) hoặc không kèm theo (xml_no_dtd) thông tin tham chiếu đến DTD của Google. Bạn nên đặt giá trị này thành xml_no_dtd. Lưu ý: Nếu bạn không chỉ định tham số này, thì kết quả sẽ được trả về ở định dạng HTML thay vì XML.
  • Tham số cx biểu thị mã nhận dạng duy nhất của công cụ.

Ngoài các tham số nêu trên, các tham số yêu cầu thường dùng nhất là:

  • num—số kết quả tìm kiếm được yêu cầu
  • q—(các) cụm từ tìm kiếm
  • start – chỉ mục bắt đầu cho kết quả

Truy vấn WebSearch mẫu

Các ví dụ dưới đây cho thấy một số yêu cầu HTTP của WebSearch để minh hoạ cách sử dụng các tham số truy vấn khác nhau. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn WebSearchTham số truy vấn tìm kiếm nâng cao của tài liệu này.

Yêu cầu này yêu cầu 10 kết quả đầu tiên (start=0&num=10) cho cụm từ truy vấn "red sox" (q=red+sox). Truy vấn này cũng chỉ định rằng kết quả phải đến từ các trang web của Canada (cr=countryCA) và phải được viết bằng tiếng Pháp (lr=lang_fr). Cuối cùng, truy vấn này chỉ định các giá trị cho tham số client, outputcx, cả ba giá trị này đều là bắt buộc.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Ví dụ này sử dụng một số tham số truy vấn tìm kiếm nâng cao để tuỳ chỉnh thêm cụm từ tìm kiếm. Yêu cầu này sử dụng thông số as_q (as_q=red+sox) thay vì thông số q. Phương thức này cũng sử dụng tham số as_eq để loại trừ bất kỳ tài liệu nào chứa từ "Yankees" khỏi kết quả tìm kiếm (as_eq=yankees).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Định nghĩa tham số truy vấn WebSearch

c2coff
Mô tả

Optional . Thông số c2coff sẽ bật hoặc tắt tính năng Tìm kiếm bằng tiếng Trung giản thể và phồn thể.

Giá trị mặc định cho tham số này là 0 (không), có nghĩa là tính năng này đang bật. Giá trị của tham số c2coff là:

Giá trị Hành động
1 Đã tắt
0 Đang bật
Ví dụ q=google&c2coff=1

khách hàng
Mô tả

Bắt buộc. Tham số client phải được đặt thành google-csbe.

Ví dụ q=google&client=google-csbe

cr
Mô tả

Optional . Thông số cr giới hạn kết quả tìm kiếm trong các tài liệu bắt nguồn từ một quốc gia cụ thể. Bạn có thể dùng toán tử Boolean trong giá trị của thông số cr.

Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • vị trí địa lý của địa chỉ IP của máy chủ Web

Hãy xem phần Giá trị thông số Quốc gia (cr) để biết danh sách các giá trị hợp lệ cho thông số này.

Ví dụ q=Frodo&cr=countryNZ

cx
Mô tả

Bắt buộc. Tham số cx chỉ định một mã duy nhất giúp xác định một công cụ tìm kiếm tuỳ chỉnh. Bạn phải chỉ định một Công cụ tìm kiếm có thể lập trình bằng cách sử dụng tham số cx để truy xuất kết quả tìm kiếm qua công cụ đó.

Để tìm giá trị của tham số cx, hãy chuyển đến Bảng điều khiển > thẻ Mã của công cụ. Bạn sẽ tìm thấy giá trị đó trong vùng văn bản trong mục "Dán mã này vào trang mà bạn muốn hộp tìm kiếm của mình xuất hiện". Kết quả tìm kiếm sẽ được hiển thị trên một trang được lưu trữ trên Google.'

Ví dụ q=Frodo&cx=00255077836266642015:u-scht7a-8i

filter
Mô tả

Optional . Thông số filter kích hoạt hoặc tắt tính năng tự động lọc kết quả tìm kiếm của Google. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google.

Giá trị mặc định cho tham số filter1, cho biết tính năng này đã được bật. Các giá trị hợp lệ cho thông số này là:

Giá trị Hành động
1 Đã tắt
0 Đang bật

Lưu ý: Theo mặc định, Google áp dụng chế độ lọc cho tất cả kết quả tìm kiếm để cải thiện chất lượng của những kết quả đó.

Ví dụ q=google&filter=0

gl
Mô tả

Optional . Giá trị thông số gl là một mã quốc gia gồm hai chữ cái. Đối với các kết quả trên WebSearch, tham số gl sẽ tăng cường những kết quả tìm kiếm có quốc gia xuất xứ khớp với giá trị tham số. Hãy xem phần Mã quốc gia để biết danh sách các giá trị hợp lệ.

Việc chỉ định giá trị tham số gl trong các yêu cầu WebSearch sẽ cải thiện mức độ liên quan của các kết quả. Điều này đặc biệt đúng với khách hàng quốc tế và thậm chí cụ thể hơn là khách hàng ở những quốc gia nói tiếng Anh ngoài Hoa Kỳ.

Ví dụ

Yêu cầu này giúp cải thiện các tài liệu viết bằng Vương quốc Anh trong kết quả của WebSearch:
q=pizza&gl=uk


hl
Mô tả

Optional . Tham số hl chỉ định ngôn ngữ giao diện (ngôn ngữ máy chủ) của giao diện người dùng. Để cải thiện hiệu suất và chất lượng của kết quả tìm kiếm, bạn nên đặt tham số này một cách rõ ràng.

Xem phần Ngôn ngữ giao diện trong bài Quốc tế hoá truy vấn và trình bày kết quả để biết thêm thông tin và xem Ngôn ngữ giao diện được hỗ trợ để biết danh sách các ngôn ngữ được hỗ trợ.

Ví dụ

Yêu cầu này nhắm mục tiêu các quảng cáo về rượu vang bằng tiếng Pháp. (Vin là một thuật ngữ tiếng Pháp chỉ rượu vang.)

q=vin&ip=10.10.10.10&ad=w5&hl=fr

chất lượng cao
Mô tả

Optional . Tham số hq sẽ thêm các từ khoá truy vấn được chỉ định vào truy vấn, như thể các từ khoá đó được kết hợp với toán tử logic AND.

Ví dụ

Yêu cầu này tìm kiếm 'pizza' VÀ 'phô mai'. Biểu thức này giống với q=pizza+cheese.

q=pizza&hq=cheese


ie
Mô tả

Optional . Thông số ie đặt lược đồ mã hoá ký tự sẽ được dùng để diễn giải chuỗi truy vấn. Giá trị ie mặc định là latin1.

Xem phần Mã hoá ký tự để thảo luận về thời điểm bạn có thể cần sử dụng thông số này.

Xem phần Lược đồ mã hóa ký tự để biết danh sách các giá trị ie có thể có.

Ví dụ q=google&ie=utf8&oe=utf8
lr
Mô tả

Optional . Thông số lr (giới hạn ngôn ngữ) giới hạn kết quả tìm kiếm ở các tài liệu được viết bằng một ngôn ngữ cụ thể.

Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • thẻ meta ngôn ngữ trong tài liệu
  • ngôn ngữ chính được dùng trong phần nội dung của tài liệu
  • ngôn ngữ phụ (nếu có) được sử dụng trong phần nội dung của tài liệu

Xem phần Giá trị tập hợp Ngôn ngữ (lr) để biết danh sách các giá trị hợp lệ cho tham số này.

Ví dụ q=Frodo&lr=lang_en

num
Mô tả

Optional . Tham số num xác định số lượng kết quả tìm kiếm cần trả về.

Giá trị num mặc định là 10 và giá trị tối đa là 20. Nếu bạn yêu cầu hiển thị hơn 20 kết quả, thì hệ thống chỉ trả về 20 kết quả.

Lưu ý: Nếu tổng số kết quả tìm kiếm ít hơn số lượng kết quả yêu cầu, thì mọi kết quả tìm kiếm hiện có sẽ được trả về.

Ví dụ q=google&num=10

oe
Mô tả

Optional . Thông số oe đặt lược đồ mã hoá ký tự nên được dùng để giải mã kết quả XML. Giá trị oe mặc định là latin1.

Xem phần Mã hoá ký tự để thảo luận về thời điểm bạn có thể cần sử dụng thông số này.

Xem phần Lược đồ mã hóa ký tự để biết danh sách các giá trị oe có thể có.

Ví dụ q=google&ie=utf8&oe=utf8

output
Mô tả

Bắt buộc. Tham số output chỉ định định dạng của kết quả XML. Các giá trị hợp lệ duy nhất cho tham số này là xmlxml_no_dtd. Biểu đồ dưới đây giải thích sự khác biệt của các giá trị thông số này.

Giá trị Định dạng Trang kết quả
xml_no_dtd Kết quả XML sẽ không bao gồm câu lệnh !DOCTYPE. (Nên dùng)
xml Kết quả XML sẽ chứa một tệp tham chiếu DTD của Google. Dòng thứ hai của kết quả sẽ xác định loại định nghĩa tài liệu (DTD) mà kết quả sử dụng:
    <!DOCTYPE GSP SYSTEM "google.dtd">
Ví dụ output=xml_no_dtd
output=xml

q
Mô tả

Optional . Tham số q chỉ định cụm từ tìm kiếm do người dùng nhập. Mặc dù tham số này là không bắt buộc, nhưng bạn phải chỉ định giá trị cho ít nhất một trong các tham số truy vấn (as_epq, as_lq, as_oq, as_q) để nhận được kết quả tìm kiếm.

Bạn cũng có thể dùng một số cụm từ truy vấn đặc biệt trong giá trị của tham số q. Vui lòng xem Thuật ngữ truy vấn đặc biệt để biết danh sách và định nghĩa của những thuật ngữ này.

Bảng điều khiển của Google Tìm kiếm có một báo cáo về các cụm từ tìm kiếm hàng đầu được gửi bằng tham số q.

Lưu ý: Giá trị chỉ định cho tham số q phải là ký tự thoát URL.

Ví dụ q=vacation&as_oq=london+paris

an toàn
Mô tả

Optional . Tham số safe cho biết cách lọc kết quả tìm kiếm đối với nội dung người lớn và nội dung khiêu dâm. Giá trị mặc định của tham số safeoff. Các giá trị thông số hợp lệ là:

Giá trị Hành động
off Tắt tính năng Tìm kiếm an toàn
medium Bật tính năng Tìm kiếm an toàn
high Bật phiên bản Tìm kiếm an toàn nghiêm ngặt hơn

Vui lòng xem phần Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn để biết thêm thông tin chi tiết về tính năng này.

Ví dụ q=adult&safe=high

bắt đầu
Mô tả

Optional . Tham số start cho biết kết quả trùng khớp đầu tiên sẽ được đưa vào kết quả tìm kiếm. Tham số start sử dụng chỉ mục bắt đầu từ 0, có nghĩa là kết quả đầu tiên là 0, kết quả thứ hai là 1, v.v.

Tham số start hoạt động cùng với tham số num để xác định kết quả tìm kiếm cần trả về. Xin lưu ý rằng sẽ không có quá 1000 kết quả được trả về cho bất kỳ truy vấn nào, ngay cả khi hơn 1000 tài liệu phù hợp với truy vấn đó, vì vậy việc đặt bắt đầu từ 1000 trở lên sẽ không có kết quả nào.

Ví dụ start=10

sắp xếp
Mô tả

Optional . Tham số sort chỉ định rằng kết quả được sắp xếp theo biểu thức đã chỉ định. Ví dụ: sắp xếp theo ngày.

Ví dụ

sort=date


ud
Mô tả

Optional . Tham số ud cho biết liệu phản hồi XML có cần bao gồm URL được mã hoá IDN cho kết quả tìm kiếm hay không. Hệ thống mã hoá IDN (Tên miền quốc tế) cho phép hiển thị miền bằng ngôn ngữ bản địa, ví dụ:

http://www.花井鮨.com

Các giá trị hợp lệ cho tham số này là 1 (mặc định), có nghĩa là kết quả XML phải bao gồm các URL được mã hoá bằng IDN và 0, có nghĩa là kết quả XML không được bao gồm các URL được mã hoá bằng IDN. Nếu tham số ud được đặt thành 1, thì URL được mã hoá bằng IDN sẽ xuất hiện trong thẻ UD trong kết quả XML của bạn.

Nếu bạn đặt tham số ud thành 0, thì URL trong ví dụ trên sẽ hiển thị như sau:

http://www.xn--elq438j.com.

Lưu ý: Đây là tính năng thử nghiệm.

Ví dụ q=google&ud=1

Các tham số truy vấn bổ sung được liệt kê bên dưới hình ảnh có liên quan đến các truy vấn tìm kiếm nâng cao. Khi bạn gửi nội dung tìm kiếm nâng cao, giá trị của một số tham số (ví dụ: as_eq, as_epq, as_oq, v.v.) đều được đưa vào cụm từ tìm kiếm cho nội dung tìm kiếm đó. Hình ảnh thể hiện trang Tìm kiếm nâng cao của Google. Trên hình ảnh, tên của từng thông số tìm kiếm nâng cao được viết bằng văn bản red bên trong hoặc bên cạnh trường trên trang tương ứng với tham số đó.



Tham số truy vấn tìm kiếm nâng cao

as_dt
Mô tả

Optional . Tham số as_dt kiểm soát việc bao gồm hay loại trừ kết quả từ trang web có tên trong tham số as_sitesearch. Các giá trị ie biểu thị bao gồm và loại trừ tương ứng.

Ví dụ as_dt=i,as_dt=e

as_epq
Mô tả

Optional . Tham số as_epq xác định một cụm từ mà tất cả tài liệu trong kết quả tìm kiếm đều phải chứa. Bạn cũng có thể sử dụng cụm từ truy vấn tìm kiếm theo cụm từ để tìm một cụm từ.

Ví dụ as_epq=abraham+lincoln

as_eq
Mô tả

Optional . Tham số as_eq xác định một từ hoặc cụm từ không được xuất hiện trong bất kỳ tài liệu nào trong kết quả tìm kiếm. Bạn cũng có thể sử dụng cụm từ truy vấn loại trừ để đảm bảo rằng một từ hoặc cụm từ cụ thể sẽ không xuất hiện trong tài liệu trong tập hợp kết quả tìm kiếm.

Ví dụ

q=bass&as_eq=music.


as_lq
Mô tả

Optional . Tham số as_lq chỉ định rằng tất cả kết quả tìm kiếm phải chứa một đường liên kết đến một URL cụ thể. Bạn cũng có thể sử dụng cụm từ truy vấn link: cho loại truy vấn này.

Ví dụ

as_lq=www.google.com


as_nlo
Mô tả

Optional . Tham số as_nlo chỉ định giá trị bắt đầu cho một phạm vi tìm kiếm. Sử dụng as_nloas_nhi để thêm một phạm vi tìm kiếm toàn diện là as_nlo...as_nhi vào truy vấn.

Ví dụ

Công cụ sau đây đặt phạm vi tìm kiếm từ 5 đến 10:

as_nlo=5&as_nhi=10

as_nhi
Mô tả

Optional . Tham số as_nhi chỉ định giá trị kết thúc cho một phạm vi tìm kiếm. Sử dụng as_nloas_nhi để thêm một phạm vi tìm kiếm toàn diện là as_nlo...as_nhi vào truy vấn.

Ví dụ

Công cụ sau đây đặt phạm vi tìm kiếm từ 5 đến 10:

as_nlo=5&as_nhi=10

as_oq
Mô tả

Optional . Thông số as_oq cung cấp thêm các cụm từ tìm kiếm cần kiểm tra trong một tài liệu, trong đó mỗi tài liệu trong kết quả tìm kiếm phải chứa ít nhất một trong các cụm từ tìm kiếm bổ sung. Bạn cũng có thể sử dụng cụm từ truy vấn Boolean OR cho loại truy vấn này.

Ví dụ

q=vacation&as_oq=London+Paris


as_q
Mô tả

Optional . Tham số as_q cung cấp các cụm từ tìm kiếm cần kiểm tra trong một tài liệu. Tham số này cũng thường được dùng để cho phép người dùng chỉ định các cụm từ bổ sung cần tìm kiếm trong một nhóm kết quả tìm kiếm.

Ví dụ

q=president&as_q=John+Adams


as_qdr
Mô tả

Optional . Tham số as_qdr yêu cầu kết quả tìm kiếm trong một khoảng thời gian cụ thể (phạm vi ngày nhanh). Các giá trị sau được hỗ trợ:

d[number] yêu cầu nhận được kết quả từ số ngày được chỉ định trong quá khứ.
w[number] yêu cầu là kết quả từ số tuần được chỉ định trước.
m[number] yêu cầu là kết quả của số lượng được chỉ định của tháng qua.
y[number] yêu cầu là kết quả từ số lượng năm qua.

Ví dụ

Ví dụ sau yêu cầu kết quả từ năm trước:

as_qdr=y

Ví dụ sau đây yêu cầu kết quả từ 10 ngày qua:

as_qdr=d10

as_sitesearch
Mô tả

Optional . Tham số as_sitesearch cho phép bạn chỉ định rằng tất cả kết quả tìm kiếm phải là các trang từ một trang web nhất định. Bằng cách đặt tham số as_dt, bạn cũng có thể dùng tham số này để loại trừ các trang của một trang web nhất định khỏi kết quả tìm kiếm của bạn.

Ví dụ

q=vacation&as_sitesearch=www.google.com


Cụm từ truy vấn đặc biệt

Google WebSearch cho phép sử dụng một số cụm từ truy vấn đặc biệt để truy cập các tính năng bổ sung của công cụ tìm kiếm của Google. Bạn nên đưa các thuật ngữ truy vấn đặc biệt này vào giá trị của tham số yêu cầu q. Giống như các cụm từ truy vấn khác, các cụm từ truy vấn đặc biệt phải là ký tự thoát URL. Một số cụm từ truy vấn đặc biệt có chứa dấu hai chấm (:). Ký tự này cũng phải là ký tự thoát URL; giá trị thoát trong URL của ký tự này là %3A.

Đường liên kết ngược [link:]
Mô tả

Cụm từ truy vấn link: truy xuất tập hợp các trang web liên kết đến một URL cụ thể. Truy vấn tìm kiếm phải được định dạng là link:URL và không có dấu cách giữa cụm từ truy vấn link: và URL.

Phiên bản thoát trong URL của link:link%3A.

Bạn cũng có thể sử dụng tham số yêu cầu as_lq để gửi yêu cầu link:.

Lưu ý: Bạn không thể chỉ định bất kỳ thuật ngữ truy vấn nào khác khi sử dụng link:.

Ví dụ

http://www.google.com/search?q=link%3Awww.example.com


Boolean HOẶC Tìm kiếm [ OR ]
Mô tả

Cụm từ truy vấn OR sẽ truy xuất các tài liệu chứa một trong một loạt (hai hoặc nhiều) cụm từ truy vấn. Để sử dụng cụm từ truy vấn OR, bạn cần chèn cụm từ tìm kiếm OR (bằng chữ cái viết hoa) vào giữa mỗi cụm từ trong bộ sách.

Bạn cũng có thể sử dụng tham số yêu cầu as_oq để gửi nội dung tìm kiếm cho bất kỳ cụm từ nào trong một nhóm cụm từ.

Lưu ý: Nếu một yêu cầu tìm kiếm chỉ định cụm từ "London+OR+Paris", thì kết quả tìm kiếm sẽ bao gồm các tài liệu chứa ít nhất một trong hai từ đó. Trong một số trường hợp, tài liệu trong kết quả tìm kiếm có thể chứa cả hai từ.

Ví dụ

Tìm London hoặc Paris:

Dữ liệu do người dùng nhập:london OR paris Cụm từ truy vấn:q=london+OR+paris

Tìm kỳ nghỉ ở London hoặc Paris:

Cụm từ truy vấn:q=vacation+london+OR+paris

Tìm kỳ nghỉ và một trong các thành phố London, Paris hoặc sô cô la:

Cụm từ truy vấn:  q=vacation+london+OR+paris+OR+chocolates

Tìm sô cô la và kỳ nghỉ, hay london hoặc paris, với trọng lượng cho sô cô la thấp nhất:

Cụm từ truy vấn:  q=vacation+london+OR+paris+chocolates

Tìm kiếm kỳ nghỉ, sô cô la và hoa trong các tài liệu cũng có chứa thông tin về London hoặc Paris:

Cụm từ truy vấn:  q=vacation+london+OR+paris+chocolates+flowers

Tìm kỳ nghỉ và một trong các thành phố London hoặc Paris, đồng thời tìm kiếm một trong các loại sô cô la hoặc hoa:

Cụm từ truy vấn:  q=vacation+london+OR+paris+chocolates+OR+flowers

Loại trừ cụm từ truy vấn [-]
Mô tả

Cụm từ truy vấn loại trừ (-) giới hạn kết quả cho một yêu cầu tìm kiếm cụ thể đối với các tài liệu không chứa một từ hoặc cụm từ cụ thể. Để sử dụng cụm từ truy vấn loại trừ, bạn sẽ mở đầu từ hoặc cụm từ cần loại trừ khỏi tài liệu phù hợp bằng "-" (dấu trừ).

Phiên bản thoát trong URL của -%2D.

Cụm từ tìm kiếm loại trừ sẽ hữu ích khi một cụm từ tìm kiếm có nhiều ý nghĩa. Ví dụ: từ "bass" có thể trả về các kết quả về cá hoặc nhạc. Nếu đang tìm tài liệu về cá, bạn có thể loại trừ các tài liệu về âm nhạc khỏi kết quả tìm kiếm bằng cách sử dụng cụm từ tìm kiếm loại trừ.

Bạn cũng có thể sử dụng tham số yêu cầu as_eq để loại trừ các tài liệu khớp với một từ hoặc cụm từ cụ thể khỏi kết quả tìm kiếm.

Ví dụ Dữ liệu do người dùng nhập: bass -music
Cụm từ truy vấn: q=bass+%2Dmusic

Loại trừ loại tệp [ -filetype: ]
Mô tả

Cụm từ truy vấn -filetype: loại trừ những tài liệu có đuôi tệp cụ thể, chẳng hạn như ".pdf" hoặc ".doc" khỏi kết quả tìm kiếm. Cụm từ tìm kiếm phải được định dạng là -filetype:EXTENSION, đồng thời không có dấu cách giữa cụm từ truy vấn -filetype: và phần mở rộng được chỉ định.

Phiên bản thoát trong URL của -filetype:%2Dfiletype%3A.

Lưu ý: Bạn có thể loại trừ nhiều loại tệp khỏi kết quả tìm kiếm bằng cách thêm các cụm từ truy vấn -filetype: khác vào truy vấn của mình. Bạn nên có một cụm từ truy vấn -filetype: trong cụm từ tìm kiếm cho mỗi đuôi tệp cần loại trừ khỏi kết quả tìm kiếm.

Các loại tệp được Google hỗ trợ bao gồm:

  • Định dạng tài liệu di động Adobe (pdf)
  • Adobe PostScript (ps)
  • Hoa sen 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Hoa Sen WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (PP)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản đa dạng thức (rtf)
  • Logcat Flash (Tài chính – gỗ)
  • Văn bản (ans, txt).

Các loại tệp khác có thể được thêm trong tương lai. Bạn luôn có thể tìm thấy danh sách mới nhất trong phần Câu hỏi thường gặp về loại tệp của Google.

Ví dụ

Ví dụ này trả về các tài liệu đề cập đến "Google" nhưng không phải là tài liệu PDF:
q=Google+%2Dfiletype%3Apdf

Ví dụ này trả về các tài liệu có nhắc đến "Google" nhưng loại trừ cả tài liệu PDF và Word:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


Lọc loại tệp [ loại tệp: ]
Mô tả

Cụm từ tìm kiếm filetype: giới hạn kết quả tìm kiếm ở những tài liệu có đuôi tệp cụ thể, chẳng hạn như ".pdf" hoặc ".doc". Cụm từ tìm kiếm phải được định dạng là filetype:EXTENSION, đồng thời không có dấu cách giữa cụm từ truy vấn filetype: và phần mở rộng được chỉ định.

Phiên bản thoát trong URL của filetype:filetype%3A.

Bạn có thể giới hạn kết quả tìm kiếm ở những tài liệu khớp với một trong nhiều đuôi tệp bằng cách thêm các cụm từ tìm kiếm filetype: khác vào truy vấn của mình. Bạn nên có một cụm từ truy vấn filetype: trong truy vấn tìm kiếm cho mỗi đuôi tệp xuất hiện trong kết quả tìm kiếm. Nhiều cụm từ truy vấn filetype: phải được phân tách bằng cụm từ truy vấn OR.

Theo mặc định, kết quả tìm kiếm sẽ bao gồm các tài liệu có đuôi tệp bất kỳ.

Các loại tệp được Google hỗ trợ bao gồm:

  • Định dạng tài liệu di động Adobe (pdf)
  • Adobe PostScript (ps)
  • Hoa sen 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Hoa Sen WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (PP)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Định dạng văn bản đa dạng thức (rtf)
  • Logcat Flash (Tài chính – gỗ)
  • Văn bản (ans, txt).

Các loại tệp khác có thể được thêm trong tương lai. Bạn luôn có thể tìm thấy danh sách mới nhất trong phần Câu hỏi thường gặp về loại tệp của Google.

Ví dụ

Ví dụ này trả về các tài liệu PDF đề cập đến "Google":
q=Google+filetype%3Apdf

Ví dụ này trả về các tài liệu PDF và Word đề cập đến "Google":
q=Google+filetype%3Apdf+OR+filetype%3Adoc


Bao gồm cụm từ truy vấn [+]
Mô tả

Cụm từ truy vấn include (+) chỉ định rằng một từ hoặc cụm từ phải xuất hiện trong tất cả các tài liệu có trong kết quả tìm kiếm. Để sử dụng cụm từ tìm kiếm, bạn phải mở đầu từ hoặc cụm từ cần có trong mọi kết quả tìm kiếm bằng dấu "+".

Phiên bản thoát trong URL của + (dấu cộng) là %2B.

Bạn nên dùng + trước một từ thông dụng mà Google thường loại bỏ trước khi xác định kết quả tìm kiếm.

Ví dụ Dữ liệu do người dùng nhập: Star Wars Episode +I
Cụm từ truy vấn: q=Star+Wars+Episode+%2BI

Chỉ liên kết Tìm kiếm, tất cả cụm từ [ allinlinks: ]
Mô tả

Cụm từ tìm kiếm allinlinks: yêu cầu các tài liệu trong kết quả tìm kiếm phải chứa tất cả các từ thuộc cụm từ tìm kiếm trong các đường liên kết URL. Định dạng của cụm từ tìm kiếm là allinlinks:, theo sau là các từ trong cụm từ tìm kiếm.

Nếu cụm từ tìm kiếm của bạn chứa cụm từ tìm kiếm allinlinks:, thì Google sẽ chỉ kiểm tra các đường liên kết URL trong tài liệu đối với các từ có trong cụm từ tìm kiếm của bạn và bỏ qua các văn bản khác trong tài liệu, tiêu đề tài liệu và URL của từng tài liệu. Xin lưu ý rằng URL của tài liệu khác với các đường liên kết URL có trong tài liệu đó.

Phiên bản thoát trong URL của allinlinks:allinlinks%3A.

Ví dụ Dữ liệu do người dùng nhập:allinlinks: Google search
Cụm từ truy vấn:q=allinlinks%3A+Google+search

Tìm kiếm theo cụm từ
Mô tả

Cụm từ tìm kiếm theo cụm từ (") cho phép bạn tìm kiếm các cụm từ hoàn chỉnh bằng cách đặt các cụm từ trong dấu ngoặc kép hoặc kết nối chúng bằng dấu gạch nối.

Phiên bản thoát trong URL của " (dấu ngoặc kép) là %22.

Tính năng tìm kiếm theo cụm từ đặc biệt hữu ích khi bạn tìm những câu trích dẫn nổi tiếng hoặc tên riêng.

Bạn cũng có thể dùng tham số yêu cầu as_epq để gửi nội dung tìm kiếm theo cụm từ.

Ví dụ Dữ liệu do người dùng nhập:"Abraham Lincoln"
Cụm từ truy vấn: q=%22Abraham+Lincoln%22

Chỉ tìm kiếm văn bản, tất cả cụm từ [allintext:]
Mô tả

Cụm từ truy vấn allintext: yêu cầu mỗi tài liệu trong kết quả tìm kiếm phải chứa tất cả các từ thuộc cụm từ tìm kiếm trong phần nội dung của tài liệu. Bạn nên định dạng cụm từ tìm kiếm là allintext:, theo sau là các từ trong cụm từ tìm kiếm.

Nếu cụm từ tìm kiếm của bạn có chứa cụm từ tìm kiếm allintext:, thì Google sẽ chỉ kiểm tra các từ trong phần nội dung của tài liệu để tìm các từ đó, bỏ qua các đường liên kết trong những tài liệu đó, tiêu đề tài liệu và URL của tài liệu.

Phiên bản thoát trong URL của allintext:allintext%3A.

Ví dụ Ví dụ này chỉ định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong phần nội dung của tất cả các tài liệu có trong kết quả tìm kiếm:
Dữ liệu do người dùng nhập:allintext:Google search
Cụm từ truy vấn:q=allintext%3AGoogle+search

Tìm kiếm theo tiêu đề, một từ [intitle:]
Mô tả

Cụm từ truy vấn intitle: giới hạn kết quả tìm kiếm ở các tài liệu có chứa một từ cụ thể trong tiêu đề tài liệu. Cụm từ tìm kiếm phải được định dạng là intitle:WORD, không có dấu cách giữa cụm từ truy vấn intitle: và từ sau.

Lưu ý: Bạn có thể chỉ định nhiều từ cần phải có trong tiêu đề tài liệu bằng cách đặt cụm từ truy vấn intitle: ở trước mỗi từ. Bạn cũng có thể sử dụng cụm từ truy vấn allintitle: để chỉ định rằng tất cả các từ truy vấn đều phải có trong tiêu đề của tài liệu xuất hiện trong kết quả tìm kiếm.

Phiên bản thoát trong URL của intitle:intitle%3A.

Ví dụ

Ví dụ này quy định rằng từ "Google" phải xuất hiện trong tiêu đề của mọi tài liệu trong kết quả tìm kiếm và từ "tìm kiếm" phải xuất hiện ở bất kỳ vị trí nào trong tiêu đề, URL, đường liên kết hoặc nội dung của những tài liệu đó:
Dữ liệu do người dùng nhập:intitle:Google search
Cụm từ tìm kiếm:q=intitle%3AGoogle+search


Tìm kiếm theo tiêu đề, tất cả các cụm từ [allintitle:]
Mô tả

Cụm từ tìm kiếm allintitle: giới hạn kết quả tìm kiếm ở những tài liệu có chứa tất cả các từ tìm kiếm trong tiêu đề tài liệu. Để sử dụng cụm từ truy vấn allintitle:, hãy thêm "allintitle:" vào đầu cụm từ tìm kiếm.

Lưu ý: Việc đặt allintitle: ở đầu cụm từ tìm kiếm tương đương với việc đặt intitle: lên trước mỗi từ trong cụm từ tìm kiếm.

Phiên bản thoát URL của allintitle:allintitle%3A.

Ví dụ

Ví dụ này quy định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong tiêu đề của mọi tài liệu trong kết quả tìm kiếm:
Dữ liệu do người dùng nhập: allintitle: Google search
Cụm từ truy vấn: q=allintitle%3A+Google+search


Tìm kiếm URL, một từ khóa [inurl:]
Mô tả

Cụm từ tìm kiếm inurl: giới hạn kết quả tìm kiếm ở các tài liệu có chứa một từ cụ thể trong URL của tài liệu. Cụm từ tìm kiếm phải được định dạng là inurl:WORD và không có dấu cách giữa cụm từ truy vấn inurl: và từ sau.

Cụm từ truy vấn inurl: bỏ qua dấu chấm câu và chỉ sử dụng từ đầu tiên sau toán tử inurl:. Bạn có thể chỉ định nhiều từ cần có trong URL của tài liệu bằng cách đặt cụm từ truy vấn inurl: ở trước mỗi từ. Bạn cũng có thể sử dụng cụm từ truy vấn allinurl: để chỉ định rằng tất cả các từ tìm kiếm đều phải có trong URL của tài liệu có trong kết quả tìm kiếm.

Phiên bản thoát trong URL của inurl:inurl%3A.

Ví dụ

Ví dụ này quy định rằng từ "Google" phải xuất hiện trong URL của mọi tài liệu trong kết quả tìm kiếm và từ "tìm kiếm" phải xuất hiện ở bất kỳ vị trí nào trong tiêu đề, URL, đường liên kết hoặc nội dung của những tài liệu đó:
Dữ liệu do người dùng nhập: inurl:Google search
Cụm từ tìm kiếm: q=inurl%3AGoogle+search


Tìm kiếm URL, tất cả cụm từ [allinurl:]
Mô tả

Cụm từ tìm kiếm allinurl: giới hạn kết quả tìm kiếm ở những tài liệu có chứa tất cả các từ tìm kiếm trong URL của tài liệu. Để sử dụng cụm từ truy vấn allinurl:, hãy thêm allinurl: vào đầu cụm từ tìm kiếm.

Cụm từ truy vấn allinurl: bỏ qua dấu chấm câu nên chỉ hoạt động với các từ chứ không hoạt động trên các thành phần URL. Ví dụ: allinurl: uk/scotland sẽ chỉ hiển thị kết quả cho các tài liệu chứa từ "uk" và "scotland" trong URL, nhưng sẽ không yêu cầu hai từ đó xuất hiện theo bất kỳ thứ tự cụ thể nào hoặc được phân cách bằng dấu gạch chéo.

Phiên bản thoát trong URL của allinurl:allinurl%3A.

Ví dụ

Ví dụ này xác định rằng các từ "Google" và "tìm kiếm" phải xuất hiện trong URL của mọi tài liệu trong kết quả tìm kiếm:
Dữ liệu do người dùng nhập: allinurl: Google search
Cụm từ truy vấn: q=allinurl%3A+Google+search



Thông tin tài liệu web [thông tin:]
Mô tả

Cụm từ tìm kiếm info: truy xuất thông tin chung về một URL miễn là URL đó có trong chỉ mục tìm kiếm của Google. Cụm từ tìm kiếm phải được định dạng là info:URL, đồng thời không có dấu cách giữa cụm từ tìm kiếm info: và URL.

Phiên bản thoát URL của info:info%3A.

Lưu ý: Bạn không thể chỉ định bất kỳ thuật ngữ truy vấn nào khác khi sử dụng info:.

Ví dụ Dữ liệu do người dùng nhập: info:www.google.com
Cụm từ truy vấn: q=info%3Awww.google.com

Truy vấn hình ảnh mẫu

Các ví dụ bên dưới hiển thị một số yêu cầu HTTP hình ảnh để minh họa cách sử dụng các tham số truy vấn khác nhau. Định nghĩa cho các tham số truy vấn khác nhau được cung cấp trong phần Định nghĩa tham số truy vấn hình ảnh của tài liệu này.

Yêu cầu này yêu cầu 5 kết quả đầu tiên (start=0&num=5) cho cụm từ truy vấn "khỉ" (q=monkey), thuộc loại tệp .png. Cuối cùng, truy vấn này chỉ định các giá trị cho các tham số client, outputcx, cả ba giá trị này đều là bắt buộc.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Tham số truy vấn tìm kiếm hình ảnh

as_filetype
Mô tả

Optional . Trả về hình ảnh thuộc một loại đã chỉ định. Các giá trị được phép là: bmp, gif, png, jpgsvg.

Ví dụ q=google&as_filetype=png

ảnh imgsz
Mô tả

Optional . Trả về hình ảnh có kích thước được chỉ định, trong đó kích thước có thể là một trong các kích thước sau:

  • icon (nhỏ)
  • small|medium|large|xlarge (trung bình)
  • xxlarge (lớn)
  • huge (rất lớn)

Ví dụ q=google&as_filetype=png&imgsz=icon

loại hình ảnh
Mô tả

Optional . Trả về hình ảnh của một loại, có thể là một trong các loại sau:

  • clipart (clipart)
  • face (khuôn mặt)
  • lineart (tuyến tính)
  • news (tin tức)
  • photo (ảnh)

Ví dụ q=google&as_filetype=png&imgtype=photo

hình ảnh
Mô tả

Optional . Trả về hình ảnh đen trắng, thang màu xám hoặc hình ảnh màu:

  • mono (đen và trắng)
  • gray (thang màu xám)
  • color (màu)

Ví dụ q=google&as_filetype=png&imgc=gray

màu img
Mô tả

Optional . Trả về hình ảnh của một màu chủ đạo cụ thể:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
Ví dụ q=google&as_filetype=png&imgcolor=yellow

as_rights
Mô tả

Optional . Bộ lọc dựa trên việc cấp phép. Sau đây là các giá trị được hỗ trợ:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

Ví dụ q=cats&as_filetype=png&as_rights=cc_attribute

Giới hạn yêu cầu

Biểu đồ dưới đây liệt kê các giới hạn đối với các yêu cầu tìm kiếm mà bạn gửi tới Google:

Thành phần Hạn mức Bình luận
Thời lượng yêu cầu tìm kiếm 2048 byte  
Số lượng từ khoá truy vấn 10 bao gồm các cụm từ trong tham số sau: q, as_epq, as_eq, as_lq, as_oq, as_q
Số kết quả 20 Nếu bạn đặt tham số num thành một số lớn hơn 20, thì hệ thống chỉ trả về 20 kết quả. Để nhận được nhiều kết quả hơn, bạn cần gửi nhiều yêu cầu và tăng giá trị của thông số start với mỗi yêu cầu.

Quốc tế hoá truy vấn và trình bày kết quả

Dịch vụ Google WebSearch cho phép bạn tìm kiếm tài liệu bằng nhiều ngôn ngữ. Bạn có thể chỉ định phương thức mã hoá ký tự sẽ dùng để diễn giải yêu cầu HTTP và mã hoá phản hồi XML (bằng cách sử dụng các tham số tìm kiếm ieoe). Bạn cũng có thể lọc kết quả để chỉ bao gồm tài liệu viết bằng một số ngôn ngữ.

Những phần sau đây thảo luận các vấn đề liên quan đến việc tìm kiếm bằng nhiều ngôn ngữ:

Mã hoá ký tự

Máy chủ gửi dữ liệu (chẳng hạn như các trang web) cho tác nhân người dùng (chẳng hạn như trình duyệt) dưới dạng một chuỗi các byte được mã hoá. Sau đó, tác nhân người dùng sẽ giải mã byte thành một chuỗi ký tự. Khi gửi yêu cầu đến dịch vụ WebSearch, bạn có thể chỉ định các giao thức mã hoá cho cả cụm từ tìm kiếm và phản hồi XML mà bạn nhận được.

Bạn có thể sử dụng tham số yêu cầu ie để chỉ định cơ chế mã hoá cho các ký tự trong yêu cầu HTTP. Bạn cũng có thể sử dụng tham số oe để chỉ định lược đồ mã hoá mà Google nên sử dụng để mã hoá phản hồi XML của bạn. Nếu bạn đang sử dụng lược đồ mã hoá khác ISO-8859-1 (hoặc latin1), hãy đảm bảo rằng bạn chỉ định giá trị chính xác cho các thông số ieoe.

Lưu ý: Nếu đang cung cấp chức năng tìm kiếm cho nhiều ngôn ngữ, bạn nên sử dụng giá trị mã hoá utf8 (UTF-8) cho cả tham số ieoe.

Vui lòng tham khảo phụ lục về Lược đồ mã hoá ký tự để biết danh sách đầy đủ các giá trị mà bạn có thể sử dụng cho thông số ieoe.

Để biết thêm thông tin chung về chế độ mã hoá ký tự, vui lòng xem http://www.w3.org/TR/REC-html40/charset.html.

Ngôn ngữ giao diện

Bạn có thể sử dụng tham số yêu cầu hl để xác định ngôn ngữ của giao diện đồ hoạ của mình. Giá trị tham số hl có thể ảnh hưởng đến kết quả tìm kiếm XML, đặc biệt là đối với các cụm từ tìm kiếm quốc tế khi bạn không chỉ định rõ ràng quy định hạn chế về ngôn ngữ (sử dụng thông số lr). Trong những trường hợp như vậy, thông số hl có thể quảng bá kết quả tìm kiếm bằng chính ngôn ngữ mà người dùng nhập.

Bạn nên thiết lập rõ ràng thông số hl trong kết quả tìm kiếm để đảm bảo Google chọn các kết quả tìm kiếm có chất lượng cao nhất cho mỗi cụm từ tìm kiếm.

Vui lòng xem phần Ngôn ngữ giao diện được hỗ trợ để biết danh sách đầy đủ các giá trị hợp lệ cho thông số hl.

Tìm kiếm tài liệu bằng ngôn ngữ cụ thể

Bạn có thể sử dụng thông số yêu cầu lr để giới hạn kết quả tìm kiếm ở các tài liệu được viết bằng một ngôn ngữ hoặc một nhóm ngôn ngữ cụ thể.

Thông số lr hỗ trợ Toán tử Boolean để cho phép bạn chỉ định nhiều ngôn ngữ cần đưa vào (hoặc loại trừ) khỏi kết quả tìm kiếm.

Các ví dụ sau đây cho thấy cách bạn có thể sử dụng Toán tử Boolean để yêu cầu tài liệu bằng nhiều ngôn ngữ.

Đối với tài liệu viết bằng tiếng Nhật:

lr=lang_jp

Đối với tài liệu viết bằng tiếng Ý hoặc tiếng Đức:

lr=lang_it|lang_de

Đối với tài liệu không được viết bằng tiếng Hungary hoặc tiếng Séc:

lr=(-lang_hu).(-lang_cs)

Vui lòng xem phần Giá trị tập hợp ngôn ngữ để biết danh sách đầy đủ các giá trị có thể sử dụng cho thông số lr và phần Toán tử Boolean để thảo luận đầy đủ về việc sử dụng các toán tử này.

Tiếng Trung giản thể và tiếng Trung phồn thể là hai biến thể chữ viết của tiếng Trung. Một khái niệm tương tự có thể được viết theo cách khác nhau tuỳ theo biến thể. Khi cung cấp một truy vấn thuộc một trong hai biến thể, dịch vụ Google WebSearch có thể trả về kết quả chứa các trang thuộc cả hai biến thể.

Để sử dụng tính năng này:

  1. Đặt tham số yêu cầu c2coff thành 0
  2. Thực hiện một trong những thao tác sau:
    • Không đặt thông số yêu cầu lr
      hoặc
    • Đặt thông số yêu cầu lr thành lr=lang_zh-TW|lang_zh-CN

Ví dụ sau đây cho thấy các tham số truy vấn mà bạn sẽ đưa vào một yêu cầu cho kết quả bằng cả tiếng Trung giản thể và phồn thể. (Xin lưu ý rằng ví dụ này không bao gồm thông tin bắt buộc bổ sung, chẳng hạn như ứng dụng.)

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

Lọc kết quả

Google WebSearch cung cấp một số cách để lọc kết quả tìm kiếm của bạn:

Tự động lọc kết quả tìm kiếm

Nhằm nỗ lực cung cấp kết quả tìm kiếm tốt nhất có thể, Google dùng hai kỹ thuật để tự động lọc bỏ những kết quả tìm kiếm thường bị coi là không mong muốn:

  • Nội dung trùng lặp – Nếu nhiều tài liệu chứa thông tin giống nhau, thì chỉ tài liệu có liên quan nhất trong nhóm đó mới được đưa vào kết quả tìm kiếm của bạn.

  • Chèn chồng lên máy chủ – Nếu có nhiều kết quả tìm kiếm trên cùng một trang web, có thể Google sẽ không cho thấy mọi kết quả trên trang web đó hoặc có thể đưa ra những kết quả có thứ hạng thấp hơn trong
    thứ hạng so với trước đây.

Bạn nên bật những bộ lọc này đối với các yêu cầu tìm kiếm thông thường vì những bộ lọc này giúp cải thiện đáng kể chất lượng của hầu hết kết quả tìm kiếm. Tuy nhiên, bạn có thể bỏ qua các bộ lọc tự động này bằng cách đặt tham số truy vấn filter thành 0 trong yêu cầu tìm kiếm.

Lọc ngôn ngữ và quốc gia

Dịch vụ Google WebSearch trả về kết quả từ một chỉ mục chính của mọi tài liệu trên web. Chỉ mục chính chứa các tập hợp con gồm các tài liệu được nhóm theo những thuộc tính cụ thể, trong đó có ngôn ngữ và quốc gia xuất xứ.

Bạn có thể sử dụng các tham số yêu cầu lrcr để giới hạn kết quả tìm kiếm trong các tập hợp con của tài liệu được viết bằng các ngôn ngữ cụ thể hoặc có nguồn gốc tương ứng từ các quốc gia cụ thể.

Google WebSearch xác định ngôn ngữ của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • thẻ meta ngôn ngữ trong tài liệu
  • ngôn ngữ chính được dùng trong phần nội dung của tài liệu


Ngoài ra, vui lòng xem định nghĩa của thông số lr, phần trong mục Tìm kiếm tài liệu viết bằng ngôn ngữ cụ thểGiá trị của bộ sưu tập ngôn ngữ có thể dùng làm giá trị cho thông số lr để biết thêm thông tin về cách hạn chế kết quả theo ngôn ngữ.

Google WebSearch xác định quốc gia của một tài liệu bằng cách phân tích:

  • miền cấp cao nhất (TLD) trong URL của tài liệu
  • vị trí địa lý của địa chỉ IP của máy chủ Web

Ngoài ra, vui lòng xem định nghĩa của thông số crGiá trị thu thập quốc gia có thể dùng làm giá trị cho thông số cr để biết thêm thông tin về việc hạn chế kết quả theo quốc gia xuất xứ.

Lưu ý: Bạn có thể kết hợp giá trị ngôn ngữ và giá trị quốc gia để tuỳ chỉnh kết quả tìm kiếm. Ví dụ: bạn có thể yêu cầu giấy tờ được viết bằng tiếng Pháp và có nguồn gốc từ Pháp hoặc Canada, hoặc bạn có thể yêu cầu giấy tờ có nguồn gốc từ Hà Lan mà không phải bằng tiếng Anh. Các thông số lrcr đều hỗ trợ Toán tử Boolean.

Lọc nội dung người lớn bằng tính năng Tìm kiếm an toàn

Nhiều khách hàng của Google không muốn cho thấy kết quả tìm kiếm cho các trang web có chứa nội dung người lớn. Khi sử dụng bộ lọc Tìm kiếm an toàn của chúng tôi, bạn có thể sàng lọc kết quả tìm kiếm có chứa nội dung người lớn và loại bỏ những kết quả đó. Các bộ lọc của Google sử dụng công nghệ độc quyền để kiểm tra từ khoá, cụm từ và URL. Mặc dù không có bộ lọc nào chính xác 100% nhưng tính năng Tìm kiếm an toàn sẽ loại bỏ phần lớn nội dung người lớn khỏi kết quả tìm kiếm của bạn.

Google cố gắng cung cấp tính năng Tìm kiếm an toàn theo cách mới nhất và toàn diện nhất có thể bằng cách liên tục thu thập dữ liệu trên web và kết hợp nội dung cập nhật từ nội dung đề xuất của người dùng.

Tính năng Tìm kiếm an toàn hỗ trợ các ngôn ngữ sau:

Tiếng Hà Lan
Tiếng Anh
Tiếng Pháp
Tiếng Đức
Tiếng Ý
Tiếng Bồ Đào Nha (Brazil)
Tiếng Tây Ban Nha
Tiếng Trung phồn thể

Bạn có thể điều chỉnh mức độ mà Google lọc kết quả về nội dung người lớn bằng cách sử dụng tham số truy vấn an toàn. Bảng sau đây giải thích chế độ cài đặt tính năng Tìm kiếm an toàn của Google và ảnh hưởng của các chế độ cài đặt đó đến kết quả tìm kiếm:

Mức độ Tìm kiếm an toàn Nội dung mô tả
cao Bật phiên bản tìm kiếm an toàn nghiêm ngặt hơn.
trung bình Chặn các trang web có chứa nội dung khiêu dâm và nội dung khiêu dâm khác.
đang tắt Không lọc nội dung người lớn khỏi kết quả tìm kiếm.

* Chế độ cài đặt Tìm kiếm an toàn mặc định bị tắt.

Nếu bạn đã bật tính năng Tìm kiếm an toàn và bạn tìm thấy các trang web chứa nội dung phản cảm trong kết quả tìm kiếm, vui lòng gửi email URL của trang web đó đến địa chỉ safesearch@google.com để chúng tôi tiến hành điều tra trang web đó.

Kết quả XML

Kết quả XML của Google DTD

Google sử dụng cùng một DTD để mô tả định dạng XML cho mọi loại kết quả tìm kiếm. Nhiều thẻ và thuộc tính có thể áp dụng cho mọi loại tìm kiếm. Tuy nhiên, một số thẻ chỉ áp dụng cho một số loại tìm kiếm nhất định. Do đó, các định nghĩa trong DTD có thể ít hạn chế hơn so với các định nghĩa được đưa ra trong tài liệu này.

Tài liệu này mô tả các khía cạnh của DTD có liên quan đến WebSearch. Khi xem DTD, nếu đang xử lý WebSearch, bạn có thể yên tâm bỏ qua các thẻ và thuộc tính chưa được nêu ở đây. Nếu định nghĩa giữa DTD và tài liệu khác nhau, thì thông tin đó sẽ được lưu ý trong tài liệu này.

Google có thể trả về kết quả XML có hoặc không tham chiếu đến DTD gần đây nhất. DTD là hướng dẫn giúp các quản trị viên tìm kiếm và trình phân tích cú pháp XML hiểu được kết quả XML của Google. Vì ngữ pháp XML của Google có thể thay đổi tuỳ từng thời điểm, nên bạn không nên định cấu hình trình phân tích cú pháp nhằm sử dụng DTD để xác thực từng kết quả XML.

Ngoài ra, bạn không nên định cấu hình trình phân tích cú pháp XML để tìm nạp DTD mỗi khi bạn gửi yêu cầu tìm kiếm. Google không cập nhật DTD thường xuyên và những yêu cầu này làm phát sinh các yêu cầu về độ trễ và băng thông không cần thiết.

Bạn nên sử dụng định dạng đầu ra xml_no_dtd để nhận kết quả XML. Nếu bạn chỉ định định dạng xml đầu ra trong yêu cầu tìm kiếm, điểm khác biệt duy nhất là việc thêm dòng sau vào kết quả XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

Bạn có thể truy cập DTD mới nhất tại http://www.google.com/google.dtd.

Xin lưu ý rằng không phải tất cả các tính năng trong DTD đều có thể sử dụng hoặc được hỗ trợ vào thời điểm này.

Giới thiệu về Phản hồi XML

  • Tất cả các giá trị phần tử đều là HTML hợp lệ và phù hợp để hiển thị trừ phi có ghi chú khác trong định nghĩa thẻ XML.
  • Một số giá trị của phần tử là các URL cần được mã hoá HTML trước khi hiển thị.
  • Trình phân tích cú pháp XML của bạn nên bỏ qua các thuộc tính và thẻ không được ghi lại. Điều này cho phép ứng dụng của bạn tiếp tục hoạt động mà không cần sửa đổi nếu Google thêm các tính năng khác vào kết quả XML.
  • Một số ký tự phải được thoát khi đưa vào dưới dạng giá trị trong thẻ XML. Trình xử lý XML của bạn phải chuyển đổi các thực thể này về các ký tự thích hợp. Ví dụ: nếu bạn không chuyển đổi các thực thể đúng cách, trình duyệt có thể hiển thị ký tự & dưới dạng "&amp;". Tiêu chuẩn XML ghi lại các ký tự này; những ký tự này được sao chép trong bảng dưới đây:

    Ký tự Biểu mẫu thoát Thực thể Mã ký tự
    Ký hiệu & &amp; &#38;
    Dấu nháy đơn ' &apos; &#39;
    Dấu nháy kép " &quot; &#34;
    Dấu lớn hơn > &gt; &#62;
    Dấu nhỏ hơn < &lt; &#60;

Kết quả XML cho cụm từ tìm kiếm thông thường và nâng cao

Tìm kiếm thông thường/nâng cao: Truy vấn mẫu và kết quả XML

Yêu cầu WebSearch mẫu này yêu cầu 10 kết quả (num=10) về cụm từ tìm kiếm "socer" (q=socer), tức là từ "soccer" có chủ đích bị đánh vần sai trong ví dụ này.)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

Yêu cầu này cho ra kết quả XML dưới đây. Xin lưu ý rằng kết quả XML có một số nhận xét để cho biết vị trí một số thẻ nhất định không có trong kết quả xuất hiện.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

Tìm kiếm thông thường/nâng cao: Thẻ XML

Các phản hồi XML cho cả yêu cầu tìm kiếm thông thường và yêu cầu tìm kiếm nâng cao đều sử dụng cùng một bộ thẻ XML. Các thẻ XML này được thể hiện trong ví dụ XML ở trên và được giải thích trong các bảng dưới đây.

Các thẻ XML dưới đây được liệt kê theo thứ tự bảng chữ cái của tên thẻ và mỗi định nghĩa thẻ đều chứa nội dung mô tả về thẻ, ví dụ cho thấy cách thẻ sẽ xuất hiện trong kết quả XML và định dạng của nội dung thẻ. Nếu thẻ đó là thẻ phụ của một thẻ XML khác hoặc nếu thẻ đó có thẻ phụ hoặc thuộc tính riêng, thì thông tin đó cũng được cung cấp trong bảng định nghĩa của thẻ.

Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:

? = thẻ phụ không bắt buộc
* = 0 hoặc nhiều lần xuất hiện của thẻ phụ
+ = một hoặc nhiều lần xuất hiện của thẻ phụ
A B C D Khắc phục G C Người T M N P Hỏi R CN T U X

anchor_text
Định nghĩa

Thẻ <anchor_text> chỉ định văn bản mà bạn nên hiển thị cho người dùng để xác định nhãn tinh chỉnh được liên kết với một nhóm kết quả tìm kiếm. Vì các nhãn tinh lọc thay thế các ký tự không phải chữ và số bằng dấu gạch dưới, nên bạn không nên hiển thị giá trị của thẻ <label> trong giao diện người dùng. Thay vào đó, bạn nên hiển thị giá trị của thẻ <anchor_text>.

Ví dụ <anchor_text>Sân gôn</anchor_text>
Thẻ phụ của FacetItem
Định dạng nội dung Văn bản

CHẶN
Định nghĩa

Thẻ này bao gồm nội dung của khối trong dòng nội dung của kết quả khuyến mãi. Mỗi khối có các thẻ phụ T, UL. Thẻ T không trống biểu thị khối có chứa văn bản; thẻ UL không trống biểu thị khối có chứa một liên kết (với URL được cung cấp trong thẻ phụ U và văn bản liên kết trong thẻ phụ L).

Thẻ phụ T, U, L
Thẻ phụ của BODY_LINE
Định dạng nội dung Trống

BODY_LINE
Định nghĩa

Thẻ này bao gồm nội dung của một dòng trong phần nội dung của kết quả được quảng cáo. Mỗi dòng nội dung bao gồm một số thẻ BLOCK, trong đó chứa một số văn bản hoặc một đường liên kết có URL và văn bản liên kết.

Thẻ phụ CHẶN*
Thẻ phụ của SL_MAIN
Định dạng nội dung Trống

C
Định nghĩa

Thẻ <C> cho biết rằng dịch vụ WebSearch có thể truy xuất phiên bản đã lưu trong bộ nhớ đệm của URL kết quả tìm kiếm này. Bạn không thể truy xuất các trang đã lưu vào bộ nhớ đệm thông qua XML API, nhưng có thể chuyển hướng người dùng đến www.google.com đối với nội dung này.

Thuộc tính
Tên Định dạng Nội dung mô tả
SZ Văn bản (Số nguyên + "k") Cung cấp kích thước của phiên bản kết quả tìm kiếm đã lưu vào bộ nhớ đệm, tính bằng kilobyte ("k").
Mã khách hàng Văn bản Xác định một tài liệu trong bộ nhớ đệm của Google. Để tìm nạp tài liệu từ bộ nhớ đệm, hãy gửi một cụm từ tìm kiếm được tạo như sau:
bộ nhớ đệm:CIDtext:escapedURL

URL thoát có trong thẻ UE.

Ví dụ <C SZ="6k" CID="kvOXK_cYSSgJ" />
Thẻ phụ của HAS
Định dạng nội dung Trống

C2C (C2C)
Định nghĩa Thẻ <C2C> cho biết rằng kết quả đề cập đến một trang tiếng Trung phồn thể. Thẻ này chỉ xuất hiện khi bạn bật Tìm kiếm bằng tiếng Trung giản thể và phồn thể. Hãy xem định nghĩa về tham số truy vấn c2coff để biết thêm thông tin về cách bật và tắt tính năng này.
Định dạng nội dung Văn bản

Bối cảnh
Định nghĩa

Thẻ <Context> đóng gói danh sách các nhãn tinh lọc được liên kết với một nhóm kết quả tìm kiếm.

Ví dụ <Context>
Thẻ phụ title, Khía cạnh+
Định dạng nội dung Vùng chứa

Hàm CRAWLDATE
Định nghĩa

Thẻ <CRAWLDATE> xác định ngày mà trang được thu thập dữ liệu lần gần đây nhất. CRAWLDATE không được trả về cho mọi trang kết quả tìm kiếm.

Ví dụ <CRAWLDATE>Ngày 21 tháng 5, 2005</CRAWLDATE>
Thẻ phụ của R
Định dạng nội dung Văn bản

DI (Di chuyển)
Định nghĩa

Thẻ <DI> đóng gói thông tin danh mục Dự án thư mục mở (ODP) cho một kết quả tìm kiếm.

Ví dụ <DI>
Thẻ phụ DT?, DS?
Thẻ phụ của HAS
Định dạng nội dung Trống

DS
Định nghĩa

Thẻ <DS> cung cấp bản tóm tắt được liệt kê cho một danh mục duy nhất trong thư mục ODP.

Ví dụ <DS>Đăng &lt;b&gt;soccer&lt;/b&gt; trực tiếp lên Internet.</DS>
Thẻ phụ của DI
Định dạng nội dung Văn bản (có thể chứa HTML)

DT (cây thiết bị)
Định nghĩa

Thẻ <DT> cung cấp tiêu đề cho một danh mục được liệt kê trong thư mục ODP.

Ví dụ <DT>FootballConnection.net</DT>
Thẻ phụ của DI
Định dạng nội dung Văn bản (có thể chứa HTML)

Thuộc tính
Định nghĩa

Thẻ <Facet> chứa một nhóm các thẻ <FacetItem> theo logic. Bạn có thể tạo các nhóm này bằng định dạng Thông số kỹ thuật XML của Công cụ tìm kiếm có thể lập trình. Nếu bạn không tạo các nhóm này, thẻ results_xml_tag_Context><Context> sẽ chứa tối đa 4 thẻ <Facet>. Các mục trong mỗi thẻ <Facet> sẽ được nhóm để hiển thị nhưng có thể không có mối quan hệ logic.

Ví dụ <Facet>
Thẻ phụ FacetItem+, title+
Thẻ phụ của Bối cảnh
Định dạng nội dung Vùng chứa

FacetItem
Định nghĩa

Thẻ <FacetItem> đóng gói thông tin về nhãn tinh lọc được liên kết với một tập hợp kết quả tìm kiếm.

Ví dụ <FacetItem>
Thẻ phụ label, anchor_text+
Thẻ phụ của Khía cạnh
Định dạng nội dung FacetItem

FI
Định nghĩa Thẻ <FI> đóng vai trò là cờ cho biết liệu quá trình lọc tài liệu có được thực hiện cho lượt tìm kiếm hay không. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin về các bộ lọc kết quả tìm kiếm của Google.
Ví dụ <FI />
Thẻ phụ của Tái bảo vệ quyền riêng tư
Định dạng nội dung Trống

GSP
Định nghĩa

Thẻ <GSP> đóng gói tất cả dữ liệu được trả về trong kết quả tìm kiếm XML của Google. "GSP" là tên viết tắt của "Google Search Protocol" (Giao thức tìm kiếm của Google).

Thuộc tính
Tên Định dạng Nội dung mô tả
Hàm VER Văn bản (Số nguyên) Thuộc tính VER chỉ định phiên bản của kết quả tìm kiếm đầu ra. Phiên bản đầu ra hiện tại là "3.2".
Ví dụ <GSP VER="3.2">
Thẻ phụ PARAM+, Q, RES?, TM
Định dạng nội dung Trống

HAS
Định nghĩa Thẻ <HAS> đóng gói thông tin về bất kỳ tham số của yêu cầu tìm kiếm đặc biệt nào được hỗ trợ cho một URL cụ thể.

Lưu ý: Định nghĩa của <HAS> cho WebSearch hạn chế hơn so với trong DTD.

Thẻ phụ DI?, L?, C?, RT?
Thẻ phụ của R

Hàm ISURL
Định nghĩa Google sẽ trả về thẻ <ISURL> nếu cụm từ tìm kiếm được liên kết là một URL.
Thẻ phụ của GSP
Định dạng nội dung Trống

L
Định nghĩa Nếu có thẻ <L>, thì dịch vụ WebSearch có thể tìm thấy những trang web khác liên kết đến URL của kết quả tìm kiếm này. Để tìm thấy các trang web như vậy, bạn sẽ sử dụng cụm từ truy vấn đặc biệt link:.
Thẻ phụ của HAS
Định dạng nội dung Trống

label
Định nghĩa

Thẻ <label> chỉ định một nhãn tinh lọc mà bạn có thể dùng để lọc kết quả tìm kiếm mình nhận được. Để sử dụng nhãn tinh lọc, hãy thêm chuỗi more:[[label tag value]] vào giá trị của thông số q trong yêu cầu HTTP của bạn cho Google như trong ví dụ sau. Xin lưu ý rằng giá trị này phải là ký tự thoát URL trước khi bạn gửi truy vấn đến Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

Lưu ý: Thẻ <label> không giống với thẻ <Label>, giúp xác định nhãn tinh lọc được liên kết với một URL cụ thể trong kết quả tìm kiếm của bạn.

Ví dụ <label>golf_courses</label>
Thẻ phụ của FacetItem
Định dạng nội dung Văn bản

TIẾNG VIỆT
Định nghĩa

Thẻ <LANG> chứa gợi ý tốt nhất của Google về ngôn ngữ của kết quả tìm kiếm.

Ví dụ <LANG>en</LANG>
Thẻ phụ của R
Định dạng nội dung Văn bản

M
Định nghĩa

Thẻ <M> xác định tổng số kết quả ước tính cho tìm kiếm.

Lưu ý: Số liệu ước tính này có thể không chính xác.

Ví dụ <M>16200000</M>
Thẻ phụ của Tái bảo vệ quyền riêng tư
Định dạng nội dung Văn bản

Sơ sinh
Định nghĩa

Thẻ <NB> đóng gói thông tin điều hướng — đường liên kết đến trang tiếp theo của kết quả tìm kiếm hoặc trang trước đó của kết quả tìm kiếm — cho nhóm kết quả.

Lưu ý: Thẻ này chỉ xuất hiện nếu có thêm kết quả.

Ví dụ <NB>
Thẻ phụ NU?, PU?
Thẻ phụ của Tái bảo vệ quyền riêng tư
Định dạng nội dung Trống

NU (Bắc, Trung và Nam Mỹ)
Định nghĩa

Thẻ <NU> chứa đường liên kết tương đối đến trang tiếp theo của kết quả tìm kiếm.

Ví dụ <NU>/search?q=flowers&num=10&hl=vi&ie=UTF-8
&output=xml&client=test&start=10</NU>
Thẻ phụ của Lưu ý:
Định dạng nội dung Văn bản (URL tương đối)

THÔNG TIN
Định nghĩa

Thẻ <PARAM> xác định tham số đầu vào được gửi trong yêu cầu HTTP được liên kết với kết quả XML. Thông tin về thông số có trong các thuộc tính thẻ – tên, giá trị, giá trị gốc – và sẽ có một thẻ PARAM cho mỗi thông số được gửi trong yêu cầu HTTP.

Thuộc tính
Tên Định dạng Nội dung mô tả
name Văn bản Tên của thông số đầu vào.
value HTML Phiên bản ở định dạng HTML của giá trị tham số đầu vào.
original_value Văn bản Phiên bản thoát khỏi URL gốc của giá trị tham số đầu vào.
Ví dụ <PARAM name="cr" value="countryNZ" native_value="countryNZ" />
Thẻ phụ của GSP
Định dạng nội dung Phức tạp

PU
Định nghĩa

Thẻ <PU> cung cấp đường liên kết tương đối đến trang trước của kết quả tìm kiếm.

Ví dụ <PU>/search?q=flowers&num=10&hl=vi&output=xml
&client=test&start=10</PU>
Thẻ phụ của Lưu ý:
Định dạng nội dung Văn bản (URL tương đối)

Hỏi
Định nghĩa

Thẻ <Q> xác định cụm từ tìm kiếm được gửi trong yêu cầu HTTP liên kết với kết quả XML đó.

Ví dụ

<Q>pizza</Q>

Thẻ phụ của GSP
Định dạng nội dung Văn bản

R
Định nghĩa

Thẻ <R> đóng gói thông tin chi tiết về từng kết quả tìm kiếm.

Lưu ý: Định nghĩa của thẻ <R> cho WebSearch hạn chế hơn so với trong DTD.

Thuộc tính
Tên Định dạng Nội dung mô tả
N Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm này.
MIME Văn bản Cho biết loại MIME của kết quả tìm kiếm.
Thẻ phụ U, UE, T?, CRAWLDATE, S?, TIẾNG VIỆT?, HAS
Thẻ phụ của Tái bảo vệ quyền riêng tư

Trở lại
Định nghĩa

Thẻ <RES> đóng gói tập hợp kết quả tìm kiếm riêng lẻ và thông tin chi tiết về các kết quả đó.

Thuộc tính
Tên Định dạng Nội dung mô tả
SN Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm đầu tiên được trả về trong nhóm kết quả này.
VI Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm gần đây nhất được trả về trong tập hợp kết quả này.
Ví dụ <RES SN="1" EN="10">
Thẻ phụ T, FI?, XT?, NB?, R*
Thẻ phụ của GSP
Định dạng nội dung Trống

S
Định nghĩa

Thẻ <S> chứa phần trích dẫn cho kết quả tìm kiếm hiển thị các cụm từ truy vấn được in đậm. Dấu ngắt dòng được đưa vào phần trích dẫn để xuống dòng tự động cho phù hợp.

Ví dụ <S> Washington (CNN) – Một nỗ lực nhằm chấm dứt tình trạng bế tắc ở Thượng viện đối với Tổng thống Bush
Thẻ phụ của R
Định dạng nội dung Văn bản (HTML)

SL_MAIN
Định nghĩa

Thẻ này bao gồm nội dung của kết quả khuyến mãi. Sử dụng để phân tích cú pháp kết quả được thăng hạng. Văn bản liên kết và URL của đường liên kết tiêu đề lần lượt nằm trong thẻ phụ TU. Các dòng của văn bản nội dung và đường liên kết nằm trong thẻ phụ BODY_LINE.

Thẻ phụ BODY_LINE*, T, U
Thẻ phụ của SL_RESULTS
Định dạng nội dung Trống

SL_RESULTS
Định nghĩa

Thẻ vùng chứa cho kết quả được quảng bá. Một trong những thông tin này sẽ xuất hiện bất cứ khi nào bạn có chương trình khuyến mãi trong kết quả tìm kiếm. Thẻ phụ SL_MAIN chứa dữ liệu kết quả chính.

Thẻ phụ SL_MAIN*
Thẻ phụ của R
Định dạng nội dung Trống

Chính tả
Định nghĩa

Thẻ <Spelling> đóng gói một đề xuất chính tả thay thế cho truy vấn được gửi. Thẻ này chỉ xuất hiện trên trang đầu tiên của kết quả tìm kiếm. Tính năng đề xuất chính tả có bằng tiếng Anh, tiếng Trung, tiếng Nhật và tiếng Hàn.

Lưu ý: Google sẽ chỉ trả về các đề xuất chính tả cho những cụm từ tìm kiếm có giá trị thông số gl được viết bằng chữ thường.

Ví dụ <Spelling>
Thẻ phụ Đề xuất
Thẻ phụ của GSP
Định dạng nội dung Trống

Đề xuất
Định nghĩa Thẻ <suggestionsion> chứa một mục đề xuất chính tả thay thế cho cụm từ tìm kiếm được gửi. Bạn có thể sử dụng nội dung của thẻ để đề xuất cách viết khác cho người dùng tìm kiếm. Giá trị của thuộc tính q là đề xuất chính tả thoát khỏi URL mà bạn có thể sử dụng làm cụm từ truy vấn.
Thuộc tính
Tên Định dạng Mô tả
q Văn bản Thuộc tính q chỉ định phiên bản thoát khỏi URL của đề xuất chính tả.
Ví dụ <Đề xuất q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Đề xuất>
Thẻ phụ của Chính tả
Định dạng nội dung Văn bản (HTML)

T
Định nghĩa Thẻ <T> chứa tiêu đề của kết quả.
Ví dụ <T>Bờ biển Đông của Amici</T>
Thẻ phụ của R
Định dạng nội dung Văn bản (HTML)

tiêu đề
Định nghĩa

Là phần tử con của <Context>, thẻ <title> chứa tên của Công cụ tìm kiếm có thể lập trình.

Là phần tử con của <Facet>, thẻ <title> cung cấp tiêu đề cho một tập hợp các thuộc tính.

Ví dụ

Là phần tử con của <Context>: <title>My Search Engine</title>

Là phần tử con của <Facet>: <title>facet title</title>

Thẻ phụ của Ngữ cảnh, Khía cạnh
Định dạng nội dung Văn bản

TM
Định nghĩa

Thẻ <TM> xác định tổng thời gian máy chủ cần thiết để trả về kết quả tìm kiếm, tính bằng giây.

Ví dụ <TM>0,100445</TM>
Thẻ phụ của GSP
Định dạng nội dung Văn bản (Số dấu phẩy động)

TT
Định nghĩa Thẻ <TT> cung cấp mẹo tìm kiếm.
Ví dụ <TT>&lt;i&gt;Mẹo: Đối với hầu hết các trình duyệt, việc nhấn phím Quay lại sẽ tạo ra các kết quả tương tự như khi nhấp vào nút Tìm kiếm.&lt;/i&gt;</TT>
Thẻ phụ của GSP

U
Định nghĩa Thẻ <U> cung cấp URL của kết quả tìm kiếm.
Ví dụ <U>http://www.dominos.com/</U>
Thẻ phụ của R
Định dạng nội dung Văn bản (URL tuyệt đối)

UD (Ukraina)
Định nghĩa

Thẻ <UD> cung cấp URL được mã hoá IDN (Tên miền quốc tế) cho kết quả tìm kiếm. Giá trị này cho phép hiển thị miền bằng ngôn ngữ địa phương. Ví dụ: URL được mã hoá bằng IDN http://www.%E8%8A%B1%E4%BA%95.com có thể được giải mã và hiển thị dưới dạng http://www.花鮨.com. Thẻ <UD> này sẽ chỉ được đưa vào kết quả tìm kiếm cho những yêu cầu chứa tham số ud.

Lưu ý: Đây là tính năng thử nghiệm.

Ví dụ <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
Thẻ phụ của R
Định dạng nội dung Văn bản (URL được mã hoá IDN)

UE
Định nghĩa Thẻ <UE> cung cấp URL của kết quả tìm kiếm. Giá trị này được thoát URL để phù hợp để truyền dưới dạng tham số truy vấn trong URL.
Ví dụ <UE>http://www.dominos.com/</UE>
Thẻ phụ của R
Định dạng nội dung Văn bản (URL thoát khỏi URL)

XT
Định nghĩa Thẻ <XT> cho biết tổng số kết quả ước tính do thẻ M chỉ định trên thực tế biểu thị tổng số kết quả chính xác. Hãy xem phần Lọc tự động của tài liệu này để biết thêm thông tin chi tiết.
Ví dụ <XT />
Thẻ phụ của Tái bảo vệ quyền riêng tư
Định dạng nội dung Trống


Kết quả XML cho cụm từ tìm kiếm hình ảnh

Yêu cầu Hình ảnh mẫu này yêu cầu 5 kết quả (num=5) về cụm từ tìm kiếm "khỉ" (q=k).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Yêu cầu này cho ra kết quả XML dưới đây.


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

Tìm kiếm hình ảnh: Thẻ XML

Bảng dưới đây trình bày các thẻ XML khác được dùng trong phản hồi XML cho các cụm từ tìm kiếm hình ảnh.

Một số biểu tượng có thể xuất hiện bên cạnh một số thẻ phụ trong phần định nghĩa bên dưới. Những biểu tượng này và ý nghĩa của chúng là:

? = thẻ phụ không bắt buộc
* = 0 hoặc nhiều lần xuất hiện của thẻ phụ
+ = một hoặc nhiều lần xuất hiện của thẻ phụ

RG (Bulgaria)
Định nghĩa

Thẻ <RG> cung cấp thông tin chi tiết về kết quả tìm kiếm hình ảnh riêng lẻ.

Thuộc tính
Tên Định dạng Nội dung mô tả
N Văn bản (Số nguyên) Cho biết chỉ mục (dựa trên 1) của kết quả tìm kiếm này.
MIME Văn bản Cho biết loại MIME của kết quả tìm kiếm.
Thẻ phụ của Tái bảo vệ quyền riêng tư
RU (Nga)
Định nghĩa

Thẻ <RU tag> chứa thông tin chi tiết của từng kết quả tìm kiếm hình ảnh.

Thẻ phụ của R