Mengompensasi perluasan, interpretasi, dan pengoptimalan default

Google Cloud Search memiliki beberapa ekspansi, interpretasi, dan pengoptimalan default yang memengaruhi hasil penelusuran. Jika Anda menemukan hasil yang tidak terduga dari kueri penelusuran, baca panduan ini sebelum menghubungi dukungan Cloud Search.

Perluasan default

Misalnya pengguna melakukan penelusuran menggunakan string, seperti [PDF Joko], tetapi beberapa hasil yang ditampilkan berisi kata yang ditandai, seperti “dokumen”, bukan "PDF". Mengapa hasil berisi kata yang ditandai yang tidak ada dalam kueri penelusuran?

Secara default, Google Cloud Search, seperti Google Web Search, tidak hanya menelusuri kata yang sama persis dalam kueri. Sebagai gantinya, Cloud Search akan memperluas kueri untuk menyertakan sinonim dan bentuk dasar kata (meskipun Anda belum menerapkan sinonim Anda sendiri). Perluasan ini dilakukan untuk mengambil dokumen yang sangat cocok dengan ide dan intent kueri. Setelah serangkaian dokumen yang luas ini dipilih, algoritma peringkat berfungsi untuk memastikan bahwa kecocokan terbaik ditempatkan di bagian atas kumpulan hasil.

Saat pengguna menelusuri [PDF Joko], Cloud Search memberikan hal berikut sebagai kata-kata tambahan yang dapat diterima:

  • Untuk [Joe's], Cloud Search mungkin juga cocok dengan "joe" (ekspansi batang) dan "joes" (sinonim berdasarkan tanda baca).
  • Untuk [PDF], Cloud Search mungkin juga cocok dengan "dokumen" (ekspansi sinonim) dan "pdf" (ekspansi batang).

Secara default, sinonim tidak harus dua arah. Misalnya, jika pengguna menelusuri istilah "phishing", Cloud Search mungkin cocok dengan "phish" sebagai perluasan sinonim. Namun, jika pengguna menelusuri istilah "phish", Google mungkin tidak cocok dengan "phishing" sebagai perluasan.

Perluasan kata dengan tanda hubung vs tanpa tanda hubung

Saat pengguna menelusuri kata yang diawali dengan tanda hubung versus kata yang tidak ditulis dengan tanda hubung, seperti [walk-in closet] dan [walk-in closet], Cloud Search akan menangani kueri ini secara berbeda.

Selain itu, pengoptimalan yang berbeda digunakan untuk kata dengan tanda hubung dan bergaris bawah, seperti [walk-in] dan [walk_in].

Mengompensasi perluasan default

Tidak ada jaminan untuk perluasan apa pun secara default. Jika Anda ingin memastikan sinonim dua arah atau perluasan sinonim khusus domain, buat kumpulan sinonim khusus domain Anda sendiri. Untuk mengetahui informasi lebih lanjut mengenai cara menerapkan sinonim, lihat Menentukan sinonim.

Penafsiran default

Cloud Search juga menyediakan interpretasi bahasa alami yang menafsirkan objek, properti, dan nilai kolom yang digunakan dalam kueri sesuai dengan skema yang diupload untuk sumber data tertentu. Untuk mengetahui informasi lebih lanjut tentang interpretasi bahasa alami ini, lihat Membuat struktur skema untuk mendapatkan interpretasi kueri yang optimal.

Menonaktifkan penafsiran bahasa alami

Guna menonaktifkan penafsiran bahasa alami untuk kueri tertentu, tetapkan QueryInterpretationOptions.disableNlInterpretation ke true dalam permintaan penelusuran.

Pengoptimalan default

Cloud Search juga memberikan pengoptimalan default ini:

  • Penggabungan hasil yang diberikan oleh koreksi ejaan. Misalnya, jika string kuerinya adalah [manfaat perusahaan], Cloud Search akan mencocokkan "corpoate" dan ejaan "perusahaan" yang benar.

  • Untuk kueri yang akan memberikan sedikit atau nol hasil, Cloud Search menggunakan kumpulan istilah terkait yang lebih permisif, yang lebih luas daripada sinonim langsung, saat mencocokkan hasil. Untuk mengetahui informasi lebih lanjut, lihat Menangani hasil tambahan.

Menormalkan dokumen dan kueri

Normalisasi mengacu pada standardisasi kata atau frasa tertentu sebelum atau setelah kueri dibuat. Untuk memastikan respons yang lebih konsisten terhadap kueri Anda, pertimbangkan untuk menormalkan dokumen Anda (sebelum atau selama pengindeksan) dan kueri (setelah pengguna membuat kueri) dengan cara berikut:

  • Untuk menormalisasi dokumen:

    1. Pilih ejaan kanonis untuk kata penting yang digunakan dalam dokumen di dalam repositori Anda.
    2. Perbaiki ejaan dalam dokumen repositori sumber, atau saat mengindeks konten, agar cocok dengan ejaan kanonis.
  • Untuk menormalisasi kueri:

    1. Intersepsi kueri pengguna sebelum mengirimkannya ke Cloud Search.
    2. Tulis ulang kata dalam kueri pengguna untuk mencocokkan ejaan yang paling umum dalam sumber data yang diindeks.
    3. Kirim kueri ke Cloud Search.

Nonaktifkan perluasan, interpretasi, dan pengoptimalan untuk semua kueri

Untuk menonaktifkan perluasan, interpretasi, dan pengoptimalan untuk kueri tertentu, tetapkan QueryInterpretationOptions.enableVerbatim Mode ke true dalam permintaan penelusuran.