Google Cloud Search memiliki beberapa perluasan, interpretasi, dan pengoptimalan default yang memengaruhi hasil penelusuran. Jika Anda melihat hasil yang tidak terduga dari kueri penelusuran, lihat panduan ini sebelum menghubungi dukungan Cloud Search.
Perluasan default
Misalkan pengguna melakukan penelusuran menggunakan string, seperti [PDF Joe], tetapi beberapa hasil yang ditampilkan berisi kata yang ditandai, seperti “dokumen”, bukan "PDF". Mengapa hasilnya berisi kata-kata yang disoroti yang tidak ada dalam kueri penelusuran?
Secara default, Google Cloud Search, seperti Google Penelusuran Web, tidak hanya menelusuri kata-kata yang sama persis dalam kueri. Sebagai gantinya, Cloud Search memperluas kueri untuk menyertakan sinonim dan batang kata (meskipun Anda belum menerapkan sinonim Anda sendiri). Perluasan ini dilakukan untuk mengambil dokumen yang secara luas cocok dengan ide dan maksud kueri. Setelah kumpulan dokumen yang luas ini dipilih, algoritma peringkat akan bekerja untuk memastikan bahwa kecocokan terbaik ditempatkan di bagian atas kumpulan hasil.
Saat pengguna menelusuri [PDF Joe], Cloud Search memberikan kata-kata tambahan berikut yang dapat diterima:
- Untuk [Joe’s], Cloud Search juga dapat mencocokkan "joe" (perluasan batang kata) dan "joes" (sinonim berdasarkan tanda baca).
- Untuk [PDF], Cloud Search juga dapat mencocokkan "dokumen" (perluasan sinonim) dan "pdf" (perluasan batang kata).
Secara default, sinonim tidak selalu bersifat dua arah. Misalnya, jika pengguna menelusuri istilah “phishing”, Cloud Search mungkin mencocokkan “phish” sebagai perluasan sinonim. Namun, jika pengguna menelusuri istilah “phish”, Google mungkin tidak mencocokkan “phishing” sebagai perluasan.
Perluasan untuk kata yang menggunakan tanda hubung dan yang tidak menggunakan tanda hubung
Saat pengguna menelusuri kata yang memiliki tanda hubung versus kata yang tidak memiliki tanda hubung, seperti [walk-in closet] dan [walk in closet], Cloud Search memperlakukan kueri ini secara berbeda.
Selain itu, pengoptimalan yang berbeda digunakan untuk kata yang dihubungkan dengan tanda hubung dan garis bawah, seperti [datang langsung] dan [datang_langsung].
Mengompensasi perluasan default
Tidak ada jaminan perluasan secara default. Jika Anda ingin memastikan bidireksionalitas sinonim atau perluasan sinonim khusus domain, buat set sinonim khusus domain Anda sendiri. Untuk mengetahui informasi lebih lanjut tentang cara menerapkan sinonim, lihat Menentukan sinonim.
Interpretasi default
Cloud Search juga menyediakan interpretasi bahasa alami yang menginterpretasikan objek, properti, dan nilai kolom yang digunakan dalam kueri sesuai dengan skema yang diupload untuk sumber data tertentu. Untuk mengetahui informasi lebih lanjut tentang interpretasi bahasa alami ini, lihat Menyusun skema untuk interpretasi kueri yang optimal.
Menonaktifkan interpretasi bahasa alami
Untuk menonaktifkan interpretasi bahasa alami untuk kueri tertentu, tetapkan
QueryInterpretationOptions.disableNlInterpretation
ke true
dalam permintaan penelusuran.
Pengoptimalan default
Cloud Search juga menyediakan pengoptimalan default berikut:
Menggabungkan hasil yang diberikan oleh koreksi ejaan. Misalnya, jika string kueri adalah [manfaat perusahaan], Cloud Search akan mencocokkan "manfaat" dan ejaan yang benar dari “perusahaan”.
Untuk kueri yang akan menghasilkan nol atau sedikit hasil, Cloud Search menggunakan serangkaian istilah terkait yang lebih permisif, yang lebih luas daripada sinonim langsung, saat mencocokkan hasil. Untuk mengetahui informasi selengkapnya, lihat bagian Menangani hasil tambahan.
Menormalisasi dokumen dan kueri
Normalisasi mengacu pada standarisasi kata atau frasa tertentu sebelum atau setelah kueri dibuat. Untuk memastikan respons yang lebih konsisten terhadap kueri Anda, pertimbangkan untuk menormalisasi dokumen (sebelum atau selama pengindeksan) dan kueri (setelah pengguna membuat kueri) dengan cara berikut:
Untuk menormalisasi dokumen:
- Pilih ejaan kanonis untuk kata-kata penting yang digunakan dalam dokumen di dalam repositori Anda.
- Koreksi ejaan dalam dokumen repositori sumber, atau saat mengindeks konten, agar sesuai dengan ejaan kanonis.
Untuk menormalisasi kueri:
- Menyadap kueri pengguna sebelum mengirimkannya ke Cloud Search.
- Menulis ulang kata dalam kueri pengguna agar cocok dengan ejaan yang paling umum di sumber data yang diindeks.
- Kirim kueri ke Cloud Search.
Menonaktifkan perluasan, interpretasi, dan pengoptimalan untuk semua kueri
Untuk menonaktifkan perluasan, interpretasi, dan pengoptimalan untuk kueri tertentu,
tetapkan
QueryInterpretationOptions.enableVerbatim Mode
ke true
dalam permintaan penelusuran.