Mengompensasi perluasan, interpretasi, dan pengoptimalan default

Google Cloud Search memiliki beberapa perluasan, interpretasi, dan pengoptimalan default yang memengaruhi hasil penelusuran. Jika Anda melihat hasil yang tidak terduga dari kueri penelusuran, lihat panduan ini sebelum menghubungi dukungan Cloud Search.

Perluasan default

Misalkan pengguna menelusuri menggunakan string, seperti [PDF Joe], tetapi beberapa hasil yang ditampilkan berisi kata yang ditandai, seperti "dokumen", bukan "PDF". Mengapa hasil berisi kata yang ditandai yang tidak ada dalam kueri penelusuran?

Secara default, Google Cloud Search, seperti Google Penelusuran Web, tidak hanya menelusuri kata-kata yang sama persis dalam kueri. Sebagai gantinya, Cloud Search akan memperluas kueri untuk menyertakan sinonim dan akar kata (meskipun Anda belum menerapkan sinonim Anda sendiri). Perluasan ini dilakukan untuk mengambil dokumen yang secara luas cocok dengan ide dan intent kueri. Setelah kumpulan dokumen yang luas ini dipilih, algoritma peringkat akan bekerja untuk memastikan bahwa kecocokan terbaik ditempatkan di bagian atas kumpulan hasil.

Saat pengguna menelusuri [PDF Joe], Cloud Search memberikan kata-kata berikut sebagai kata tambahan yang dapat diterima:

  • Untuk [Joe's], Cloud Search mungkin juga mencocokkan "joe" (ekspansi batang) dan "joes" (sinonim berdasarkan tanda baca).
  • Untuk [PDF], Cloud Search mungkin juga mencocokkan "documents" (ekspansi sinonim) dan "pdf" (ekspansi akar kata).

Secara default, sinonim tidak harus bersifat dua arah. Misalnya, jika pengguna menelusuri istilah “phishing”, Cloud Search mungkin mencocokkan “phish” sebagai perluasan sinonim. Namun, jika pengguna menelusuri istilah “phish”, Google mungkin tidak mencocokkan “phishing” sebagai perluasan.

Perluasan untuk kata yang dihubungkan dengan tanda hubung versus kata yang tidak dihubungkan dengan tanda hubung

Saat pengguna menelusuri kata dengan tanda hubung versus kata yang setara tanpa tanda hubung, seperti [walk-in closet] dan [walk in closet], Cloud Search akan memperlakukan kueri ini secara berbeda.

Selain itu, pengoptimalan yang berbeda digunakan untuk kata yang dihubungkan dengan tanda hubung dan digarisbawahi, seperti [walk-in] dan [walk_in].

Mengkompensasi perluasan default

Tidak ada jaminan perluasan apa pun secara default. Jika Anda ingin memastikan dua arah sinonim atau perluasan sinonim khusus domain, buat kumpulan sinonim khusus domain Anda sendiri. Untuk informasi lebih lanjut tentang cara menerapkan sinonim, lihat Menentukan sinonim.

Penafsiran default

Cloud Search juga menyediakan interpretasi bahasa alami yang menafsirkan objek, properti, dan nilai kolom yang digunakan dalam kueri sesuai dengan skema yang diupload untuk sumber data tertentu. Untuk mengetahui informasi lebih lanjut tentang interpretasi bahasa alami ini, lihat Membuat struktur skema untuk mendapatkan interpretasi kueri yang optimal.

Menonaktifkan interpretasi bahasa alami

Untuk menonaktifkan interpretasi bahasa alami untuk kueri tertentu, tetapkan QueryInterpretationOptions.disableNlInterpretation ke true dalam permintaan penelusuran.

Pengoptimalan default

Cloud Search juga menyediakan pengoptimalan default berikut:

  • Menggabungkan hasil yang diberikan oleh koreksi ejaan. Misalnya, jika string kueri adalah [corpoate benefits], Cloud Search akan mencocokkan "corpoate" dan ejaan yang benar dari “corporate”.

  • Untuk kueri yang akan menghasilkan nol atau sedikit hasil, Cloud Search menggunakan kumpulan istilah terkait yang lebih permisif, lebih luas daripada sinonim langsung, saat mencocokkan hasil. Untuk informasi selengkapnya, lihat Menangani hasil tambahan.

Mennormalisasi dokumen dan kueri

Normalisasi mengacu pada standarisasi kata atau frasa tertentu sebelum atau setelah kueri dibuat. Untuk memastikan respons yang lebih konsisten terhadap kueri, sebaiknya normalisasi dokumen (sebelum atau selama pengindeksan) dan kueri (setelah pengguna membuat kueri) dengan cara berikut:

  • Untuk menormalisasi dokumen:

    1. Pilih ejaan kanonis untuk kata-kata penting yang digunakan dalam dokumen dalam repositori Anda.
    2. Perbaiki ejaan dalam dokumen repositori sumber, atau saat mengindeks konten, agar cocok dengan ejaan kanonis.
  • Untuk menormalisasi kueri:

    1. Mencegat kueri pengguna sebelum mengirimnya ke Cloud Search.
    2. Tulis ulang kata dalam kueri pengguna agar cocok dengan ejaan yang paling umum di sumber data yang diindeks.
    3. Kirim kueri ke Cloud Search.

Menonaktifkan perluasan, interpretasi, dan pengoptimalan untuk semua kueri

Untuk menonaktifkan perluasan, interpretasi, dan pengoptimalan untuk kueri tertentu, tetapkan QueryInterpretationOptions.enableVerbatim Mode ke true dalam permintaan penelusuran.