Google Cloud Search có một số chế độ mở rộng, diễn giải và tối ưu hoá mặc định ảnh hưởng đến kết quả tìm kiếm. Nếu bạn thấy kết quả tìm kiếm không mong muốn, hãy tham khảo hướng dẫn này trước khi liên hệ với nhóm hỗ trợ Cloud Search.
Trong tài liệu này, cụm từ tìm kiếm của người dùng được đặt trong dấu ngoặc (như [query]) và nội dung diễn giải của hệ thống được đặt trong dấu ngoặc kép (như "interpretation").
Kết quả truy vấn trong tài liệu này là ví dụ minh hoạ về hành vi và cung cấp thông tin chi tiết về cách hoạt động của các tính năng mở rộng, diễn giải và tối ưu hoá; kết quả thực tế có thể khác.
Mức mở rộng mặc định
Giả sử người dùng tìm kiếm [Joe’s PDFs], nhưng một số kết quả lại chứa các từ được làm nổi bật như "documents" thay vì "PDFs". Điều này xảy ra vì Cloud Search mở rộng cụm từ tìm kiếm để bao gồm các từ đồng nghĩa và gốc từ, tương tự như Google Tìm kiếm. Việc mở rộng này giúp truy xuất những tài liệu phù hợp với ý tưởng và ý định của cụm từ tìm kiếm. Sau đó, các thuật toán xếp hạng sẽ đảm bảo những kết quả phù hợp nhất xuất hiện ở đầu.
Khi người dùng tìm kiếm [Joe’s PDFs], Cloud Search có thể cung cấp những từ bổ sung sau:
- Đối với
[Joe’s], có thể khớp với"joe"(mở rộng gốc từ) và"joes"(từ đồng nghĩa dựa trên dấu câu). - Đối với
[PDFs], có thể khớp với"documents"(mở rộng từ đồng nghĩa) và"pdf"(mở rộng gốc từ).
Từ đồng nghĩa mặc định không phải lúc nào cũng có hai chiều. Ví dụ: cụm từ tìm kiếm [phishing] có thể khớp với "phish", nhưng cụm từ tìm kiếm [phish] có thể không khớp với "phishing".
Các từ mở rộng cho từ có dấu gạch ngang và dấu gạch dưới
Cloud Search xử lý các từ có dấu gạch ngang và các từ tương đương không có dấu gạch ngang theo cách khác nhau, chẳng hạn như [walk-in closet] và [walk in closet].
Công cụ này cũng áp dụng các phương pháp tối ưu hoá khác nhau cho những từ có dấu gạch ngang và dấu gạch dưới, chẳng hạn như [walk-in] và [walk_in].
Bù cho các phần mở rộng mặc định
Cloud Search không đảm bảo bất kỳ hoạt động mở rộng cụ thể nào. Để đảm bảo các từ đồng nghĩa hai chiều hoặc các từ mở rộng theo miền cụ thể, hãy tạo từ đồng nghĩa của riêng bạn. Để biết thêm thông tin, hãy xem bài viết Xác định từ đồng nghĩa.
Cách diễn giải mặc định
Cloud Search cung cấp tính năng diễn giải bằng ngôn ngữ tự nhiên dựa trên giản đồ nguồn dữ liệu của bạn. Để biết thêm thông tin, hãy xem phần Cấu trúc lược đồ để diễn giải truy vấn tối ưu.
Tắt tính năng diễn giải bằng ngôn ngữ tự nhiên
Để tắt tính năng diễn giải ngôn ngữ tự nhiên cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.disableNlInterpretation thành true trong yêu cầu tìm kiếm.
Tối ưu hoá mặc định
Cloud Search cung cấp những chế độ tối ưu hoá mặc định sau:
Kết hợp sửa lỗi chính tả: Đối với cụm từ tìm kiếm
[corpoate benefits], Cloud Search sẽ so khớp"corpoate"và lỗi chính tả,"corporate".Kết quả bổ sung: Đối với những cụm từ tìm kiếm có ít hoặc không có kết quả, Cloud Search sẽ sử dụng một tập hợp các cụm từ liên quan mang tính cho phép. Để biết thêm thông tin, hãy xem phần Xử lý kết quả bổ sung.
Chuẩn hoá tài liệu và truy vấn
Chuẩn hoá là quá trình chuẩn hoá các từ hoặc cụm từ trước hoặc sau một cụm từ tìm kiếm. Để đảm bảo các câu trả lời nhất quán, hãy cân nhắc các bước chuẩn hoá sau:
Cách chuẩn hoá tài liệu:
- Chọn cách viết chuẩn cho các từ quan trọng trong kho lưu trữ của bạn.
- Chính tả đúng trong tài liệu nguồn hoặc trong quá trình lập chỉ mục để khớp với dạng chính tắc.
Cách chuẩn hoá truy vấn:
- Chặn các cụm từ tìm kiếm của người dùng trước khi gửi đến Cloud Search.
- Viết lại các từ trong cụm từ tìm kiếm để khớp với cách viết chính tả phổ biến nhất trong nguồn dữ liệu được lập chỉ mục.
- Gửi cụm từ tìm kiếm được viết lại đến Cloud Search.
Tắt tính năng mở rộng, diễn giải và tối ưu hoá
Để tắt các tính năng này cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.enableVerbatimMode thành true trong yêu cầu tìm kiếm.