Google Cloud Search có một số chế độ mở rộng, diễn giải và tối ưu hoá mặc định ảnh hưởng đến kết quả tìm kiếm. Nếu bạn thấy kết quả không mong muốn từ các cụm từ tìm kiếm, hãy tham khảo hướng dẫn này trước khi liên hệ với nhóm hỗ trợ Cloud Search.
Mức mở rộng mặc định
Giả sử người dùng đang tìm kiếm bằng một chuỗi, chẳng hạn như [PDF của Joe], nhưng một số kết quả trả về có chứa các từ được làm nổi bật, chẳng hạn như "tài liệu" thay vì "PDF". Tại sao kết quả lại chứa những từ được đánh dấu không có trong cụm từ tìm kiếm?
Theo mặc định, Google Cloud Search (giống như Google Web Search) không chỉ tìm kiếm các từ chính xác trong một cụm từ tìm kiếm. Thay vào đó, Cloud Search sẽ mở rộng cụm từ tìm kiếm để bao gồm các từ đồng nghĩa và gốc từ (ngay cả khi bạn chưa triển khai từ đồng nghĩa của riêng mình). Việc mở rộng này được thực hiện để truy xuất những tài liệu phù hợp với ý tưởng và ý định của truy vấn. Sau khi chọn được nhóm tài liệu rộng này, các thuật toán xếp hạng sẽ hoạt động để đảm bảo rằng những kết quả phù hợp nhất được đặt ở đầu nhóm kết quả.
Khi người dùng tìm kiếm [Joe’s PDFs] (Tệp PDF của Joe), Cloud Search đã cung cấp những từ sau đây làm từ bổ sung được chấp nhận:
- Đối với [Joe’s], Cloud Search cũng có thể so khớp "joe" (một bản mở rộng gốc từ) và "joes" (một từ đồng nghĩa dựa trên dấu câu).
- Đối với [PDF], Cloud Search cũng có thể khớp với "tài liệu" (một từ đồng nghĩa mở rộng) và "pdf" (một từ gốc mở rộng).
Theo mặc định, từ đồng nghĩa không nhất thiết phải là từ hai chiều. Ví dụ: nếu người dùng tìm kiếm cụm từ "tấn công giả mạo", thì Cloud Search có thể so khớp "giả mạo" dưới dạng một từ đồng nghĩa mở rộng. Tuy nhiên, nếu người dùng tìm kiếm cụm từ "phish", thì Google có thể không khớp "phishing" dưới dạng một cụm từ mở rộng.
Mở rộng cho các từ có dấu gạch nối và không có dấu gạch nối
Khi người dùng tìm kiếm các từ có dấu gạch ngang so với các từ tương đương không có dấu gạch ngang, chẳng hạn như [walk-in closet] và [walk in closet], Cloud Search sẽ xử lý các cụm từ tìm kiếm này theo cách khác nhau.
Ngoài ra, các phương pháp tối ưu hoá khác nhau được dùng cho các từ có dấu gạch ngang và dấu gạch dưới, chẳng hạn như [walk-in] và [walk_in].
Bù cho các phần mở rộng mặc định
Theo mặc định, không có gì đảm bảo rằng bạn sẽ mở rộng được. Nếu bạn muốn đảm bảo tính hai chiều của từ đồng nghĩa hoặc việc mở rộng từ đồng nghĩa theo miền cụ thể, hãy tạo bộ từ đồng nghĩa theo miền cụ thể của riêng bạn. Để biết thêm thông tin về cách triển khai từ đồng nghĩa, hãy tham khảo bài viết Xác định từ đồng nghĩa.
Cách diễn giải mặc định
Cloud Search cũng cung cấp tính năng diễn giải ngôn ngữ tự nhiên. Tính năng này diễn giải các đối tượng, thuộc tính và giá trị trường được dùng trong một cụm từ tìm kiếm theo giản đồ được tải lên cho một nguồn dữ liệu cụ thể. Để biết thêm thông tin về cách diễn giải bằng ngôn ngữ tự nhiên này, hãy tham khảo bài viết Cấu trúc giản đồ để diễn giải truy vấn một cách tối ưu.
Tắt tính năng diễn giải bằng ngôn ngữ tự nhiên
Để tắt tính năng diễn giải ngôn ngữ tự nhiên cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.disableNlInterpretation
thành true
trong yêu cầu tìm kiếm.
Tối ưu hoá mặc định
Cloud Search cũng cung cấp những chế độ tối ưu hoá mặc định sau:
Kết hợp các kết quả do tính năng sửa lỗi chính tả cung cấp. Ví dụ: nếu chuỗi truy vấn là [corpoate benefits], thì Cloud Search sẽ so khớp "corpoate" và cách viết chính xác của từ "corporate" ("doanh nghiệp").
Đối với những cụm từ tìm kiếm không có hoặc có ít kết quả, Cloud Search sẽ sử dụng một tập hợp các cụm từ liên quan mang tính cho phép hơn (rộng hơn so với từ đồng nghĩa trực tiếp) khi so khớp kết quả. Để biết thêm thông tin, hãy tham khảo phần Xử lý kết quả bổ sung.
Chuẩn hoá tài liệu và truy vấn
Chuẩn hoá là việc chuẩn hoá một số từ hoặc cụm từ nhất định trước hoặc sau khi một cụm từ tìm kiếm được thực hiện. Để đảm bảo nhận được phản hồi nhất quán hơn cho các truy vấn của bạn, hãy cân nhắc việc chuẩn hoá các tài liệu (trước hoặc trong khi lập chỉ mục) và truy vấn (sau khi người dùng thực hiện truy vấn) theo những cách sau:
Cách chuẩn hoá tài liệu:
- Chọn cách viết chuẩn cho các từ quan trọng được dùng trong tài liệu trong kho lưu trữ của bạn.
- Chỉnh chính tả trong tài liệu kho lưu trữ nguồn hoặc khi lập chỉ mục nội dung để khớp với chính tả chuẩn.
Cách chuẩn hoá truy vấn:
- Chặn các cụm từ tìm kiếm của người dùng trước khi gửi đến Cloud Search.
- Viết lại các từ trong truy vấn của người dùng để khớp với cách viết chính tả phổ biến nhất trong nguồn dữ liệu được lập chỉ mục.
- Gửi cụm từ tìm kiếm đến Cloud Search.
Tắt tính năng mở rộng, diễn giải và tối ưu hoá cho tất cả các cụm từ tìm kiếm
Để tắt tính năng mở rộng, diễn giải và tối ưu hoá cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.enableVerbatim Mode
thành true
trong yêu cầu tìm kiếm.