Google Cloud Search có một số tính năng mở rộng, diễn giải và tối ưu hoá mặc định ảnh hưởng đến kết quả tìm kiếm. Nếu bạn thấy kết quả không mong muốn từ các cụm từ tìm kiếm, hãy tham khảo hướng dẫn này trước khi liên hệ với nhóm hỗ trợ Cloud Search.
Mở rộng mặc định
Giả sử người dùng đang tìm kiếm bằng một chuỗi, chẳng hạn như [Tài liệu PDF của Joe], nhưng một số kết quả trả về chứa các từ được làm nổi bật, chẳng hạn như "tài liệu" thay vì "tài liệu PDF". Tại sao kết quả lại chứa các từ được đánh dấu không có trong cụm từ tìm kiếm?
Theo mặc định, Google Cloud Search, giống như Google Tìm kiếm trên web, không chỉ tìm kiếm các từ chính xác trong một cụm từ tìm kiếm. Thay vào đó, Cloud Search sẽ mở rộng cụm từ tìm kiếm để bao gồm các từ đồng nghĩa và gốc từ (ngay cả khi bạn chưa triển khai từ đồng nghĩa của riêng mình). Việc mở rộng này được thực hiện để truy xuất các tài liệu phù hợp chung với ý tưởng và ý định của cụm từ tìm kiếm. Sau khi nhóm tài liệu rộng này được chọn, các thuật toán xếp hạng sẽ hoạt động để đảm bảo rằng các kết quả phù hợp nhất được đặt ở đầu nhóm kết quả.
Khi người dùng tìm kiếm [Tệp PDF của Joe], Cloud Search đã cung cấp các từ sau đây làm từ bổ sung được chấp nhận:
- Đối với [Joe's], Tìm kiếm trên đám mây cũng có thể khớp với "joe" (một từ mở rộng gốc) và "joes" (một từ đồng nghĩa dựa trên dấu câu).
- Đối với [PDF], Cloud Search cũng có thể so khớp với "tài liệu" (từ mở rộng đồng nghĩa) và "pdf" (từ mở rộng gốc).
Theo mặc định, từ đồng nghĩa không nhất thiết phải hai chiều. Ví dụ: nếu người dùng tìm kiếm cụm từ "lừa đảo", thì Cloud Search có thể so khớp "lừa đảo" dưới dạng một từ đồng nghĩa mở rộng. Tuy nhiên, nếu người dùng tìm kiếm cụm từ "phish" (lừa đảo), thì Google có thể không khớp "phishing" (lừa đảo) dưới dạng cụm từ mở rộng.
Từ mở rộng cho từ có dấu gạch nối và từ không có dấu gạch nối
Khi người dùng tìm kiếm các từ có dấu gạch nối so với các từ tương đương không có dấu gạch nối, chẳng hạn như [walk-in closet] và [walk in closet], thì Cloud Search sẽ xử lý các cụm từ tìm kiếm này theo cách khác nhau.
Ngoài ra, các phương pháp tối ưu hoá khác nhau được dùng cho các từ được nối bằng dấu gạch nối và dấu gạch dưới, chẳng hạn như [walk-in] và [walk_in].
Bù cho các phần mở rộng mặc định
Theo mặc định, không có gì đảm bảo về việc mở rộng. Nếu bạn muốn đảm bảo tính hai chiều của từ đồng nghĩa hoặc mở rộng từ đồng nghĩa theo miền cụ thể, hãy tạo bộ từ đồng nghĩa theo miền cụ thể của riêng bạn. Để biết thêm thông tin về cách triển khai từ đồng nghĩa, hãy tham khảo phần Xác định từ đồng nghĩa.
Cách diễn giải mặc định
Cloud Search cũng cung cấp tính năng diễn giải bằng ngôn ngữ tự nhiên, diễn giải các đối tượng, thuộc tính và giá trị trường được sử dụng trong truy vấn theo giản đồ được tải lên cho một nguồn dữ liệu cụ thể. Để biết thêm thông tin về cách diễn giải bằng ngôn ngữ tự nhiên này, hãy tham khảo bài viết Xây dựng giản đồ để diễn giải truy vấn một cách tối ưu.
Tắt tính năng diễn giải bằng ngôn ngữ tự nhiên
Để tắt tính năng diễn giải bằng ngôn ngữ tự nhiên cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.disableNlInterpretation
thành true
trong yêu cầu tìm kiếm.
Tối ưu hoá mặc định
Cloud Search cũng cung cấp các tính năng tối ưu hoá mặc định sau:
Kết hợp kết quả do tính năng sửa lỗi chính tả cung cấp. Ví dụ: nếu chuỗi truy vấn là [corpoate benefits], thì Cloud Search sẽ so khớp "corpoate" và cách viết chính xác của "corporate".
Đối với các cụm từ tìm kiếm không trả về kết quả hoặc trả về ít kết quả, Cloud Search sẽ sử dụng một tập hợp các cụm từ liên quan có phạm vi rộng hơn so với các từ đồng nghĩa trực tiếp khi so khớp kết quả. Để biết thêm thông tin, hãy tham khảo phần Xử lý kết quả bổ sung.
Chuẩn hoá tài liệu và truy vấn
Việc chuẩn hoá đề cập đến việc chuẩn hoá một số từ hoặc cụm từ nhất định trước hoặc sau khi truy vấn. Để đảm bảo phản hồi nhất quán hơn cho các truy vấn, hãy cân nhắc việc chuẩn hoá tài liệu (trước hoặc trong quá trình lập chỉ mục) và truy vấn (sau khi người dùng thực hiện truy vấn) theo các cách sau:
Cách chuẩn hoá tài liệu:
- Chọn cách viết chuẩn cho các từ quan trọng được dùng trong tài liệu trong kho lưu trữ của bạn.
- Sửa lỗi chính tả trong tài liệu kho lưu trữ nguồn hoặc khi lập chỉ mục nội dung để khớp với chính tả chuẩn.
Cách chuẩn hoá truy vấn:
- Chặn cụm từ tìm kiếm của người dùng trước khi gửi đến Cloud Search.
- Viết lại các từ trong cụm từ tìm kiếm của người dùng để khớp với cách viết phổ biến nhất trong nguồn dữ liệu được lập chỉ mục.
- Gửi truy vấn đến Cloud Search.
Tắt tính năng mở rộng, diễn giải và tối ưu hoá cho tất cả cụm từ tìm kiếm
Để tắt tính năng mở rộng, diễn giải và tối ưu hoá cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.enableVerbatim Mode
thành true
trong yêu cầu tìm kiếm.