Kualitas penelusuran merujuk pada kualitas hasil penelusuran dari segi peringkat dan recall seperti yang diterima oleh pengguna.
Peringkat adalah urutan item, dan recall adalah jumlah item relevan yang diambil. Item (atau dokumen) adalah bagian dari konten digital yang dapat diindeks oleh Google Cloud Search, seperti dokumen Microsoft Office, file PDF, baris database, atau URL unik. Item terdiri dari:
- Metadata terstruktur
- Konten yang dapat diindeks
- ACL
Cloud Search menggunakan berbagai sinyal untuk mengambil dan menentukan peringkat hasil. Anda dapat memengaruhi sinyal ini melalui setelan dalam skema, konten dan metadata item, serta aplikasi penelusuran. Dokumen ini membantu Anda meningkatkan kualitas penelusuran dengan mengubah penentu sinyal ini.
Untuk mengetahui ringkasan setelan, lihat Ringkasan setelan kualitas penelusuran.
Memengaruhi skor topikalitas
Topikalitas adalah relevansi hasil penelusuran dengan istilah kueri. Cloud Search menghitung topikalitas berdasarkan:
- Tingkat kepentingan dari setiap istilah kueri.
- Jumlah klik (frekuensi istilah kueri muncul dalam konten atau metadata).
- Jenis kecocokan antara istilah kueri dan item yang diindeks.
Untuk memengaruhi skor topikalitas properti teks, tentukan
RetrievalImportance
dalam skema Anda. Kecocokan pada properti dengan RetrievalImportance tinggi akan menghasilkan skor yang lebih tinggi.
Misalnya, jika Anda menyimpan histori bug software, pengguna kemungkinan akan membuat kueri berdasarkan nama bug.
Tetapkan RetrievalImportance untuk nama ke HIGHEST. Untuk deskripsi, gunakan DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
Untuk dokumen HTML, tag seperti <title> dan <h1> membantu menentukan tingkat kepentingan istilah. Jika ContentFormat
adalah TEXT, ItemContent
menggunakan tingkat kepentingan DEFAULT. Jika HTML, tingkat kepentingan bergantung pada properti HTML.
Memengaruhi keaktualan
Keaktualan mengukur seberapa baru item diubah, menggunakan createTime dan
updateTime di
ItemMetadata.
Item yang lebih lama akan memiliki peringkat yang lebih rendah.
Anda dapat memengaruhi keaktualan dengan menyesuaikan freshnessProperty dan
freshnessDuration di
FreshnessOptions.
freshnessProperty memungkinkan Anda menggunakan tanggal atau stempel waktu kustom, bukan updateTime. Untuk bug, Anda dapat menggunakan batas waktu sehingga item dengan tanggal yang paling dekat dengan sekarang akan memiliki peringkat yang lebih tinggi.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Gunakan freshnessDuration untuk menentukan kapan suatu item dianggap tidak berlaku lagi. Nilai yang tinggi, seperti 100 tahun, akan menghilangkan efek keaktualan. Hal ini berguna untuk data statis seperti profil karyawan. Untuk berita, gunakan nilai kecil seperti tiga hari.
Memengaruhi kualitas
Kualitas mengukur akurasi dan kegunaan suatu item. Tentukan nilai antara 0
dan 1 menggunakan
SearchQualityMetadata.
Nilai yang lebih tinggi akan meningkatkan peringkat. Misalnya, Anda dapat meningkatkan peringkat dokumen manfaat yang dibuat oleh HR.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Memengaruhi dengan jenis kolom
Anda dapat memengaruhi peringkat berdasarkan properti enumerasi atau bilangan bulat menggunakan
OrderedRanking:
NO_ORDER(default): Tidak ada efek pada peringkat.ASCENDING: Nilai yang lebih tinggi akan meningkatkan peringkat.DESCENDING: Nilai yang lebih rendah akan meningkatkan peringkat.
Untuk prioritas bug, gunakan DESCENDING jika HIGH adalah 1 dan LOW adalah 3. Untuk properti votes, gunakan ASCENDING.
Memengaruhi peringkat melalui perluasan kueri
Perluasan kueri menggunakan sinonim dan ejaan untuk meningkatkan kualitas hasil.
Menggunakan sinonim
Cloud Search menggunakan konten web publik untuk sinonim. Anda juga dapat menentukan sinonim kustom untuk terminologi khusus organisasi. Lihat Menentukan sinonim.
Menggunakan ejaan
Cloud Search memberikan saran ejaan di
SpellResult.
Cloud Search juga menggunakan koreksi ejaan sebagai sinonim untuk menemukan dokumen.
Memengaruhi peringkat melalui setelan Aplikasi Penelusuran
Aplikasi Penelusuran memberikan informasi kontekstual. Anda dapat memengaruhi peringkat menggunakan setelan berikut.
Menyesuaikan konfigurasi pemberian skor
Tentukan
ScoringConfig
untuk menonaktifkan keaktualan atau personalisasi.
Menonaktifkan personalisasi akan menghapus pemilik dan interaksi
peningkatan. Lihat
Menyesuaikan pengalaman penelusuran.
Menyesuaikan konfigurasi sumber
Tentukan setelan tingkat sumber data:
- Tingkat kepentingan sumber: Item dari sumber dengan tingkat kepentingan
HIGHakan memiliki peringkat yang lebih tinggi. - Crowding: Membatasi hasil dari satu sumber (default adalah 3) untuk memastikan keberagaman.
Personalisasi
Personalisasi memprioritaskan hasil berdasarkan pengguna:
- Kepemilikan item: Meningkatkan peringkat item yang dimiliki oleh pengguna.
- Interaksi item: Meningkatkan peringkat item yang baru-baru ini dilihat, diedit, atau dikomentari oleh pengguna.
- Klik pengguna: Meningkatkan peringkat item yang sebelumnya diklik oleh pengguna. Jangan ubah URL hasil, karena URL tersebut digunakan untuk mengumpulkan data ini.
Interpretasi kueri
Fitur interpretasi kueri mengonversi kueri pengguna menjadi kueri terstruktur berbasis operator menggunakan definisi skema. Fitur ini memberikan hasil yang akurat meskipun dengan kata kunci yang minimal. Lihat Membuat struktur skema untuk mendapatkan interpretasi kueri yang optimal.
Bahasa item
Cloud Search menurunkan peringkat item yang bahasanya tidak cocok dengan bahasa kueri. Tetapkan languageCode di
RequestOptions
ke preferensi pengguna.
Konteks item
Gunakan
contextAttributes
untuk meningkatkan peringkat item yang relevan dengan konteks kueri, seperti lokasi atau
departemen.
Popularitas item
Cloud Search meningkatkan peringkat item yang sering diklik pengguna dalam kueri terbaru. Jangan ubah URL hasil penelusuran, karena URL tersebut digunakan untuk melacak klik ini.
Ringkasan setelan kualitas penelusuran
Tabel berikut memberikan ringkasan setelan kualitas penelusuran:
Setelan skema
| Setelan | Lokasi | Rekomendasi | Detail |
|---|---|---|---|
ItemContent |
ItemContent |
Disarankan | Topikalitas |
RetrievalImportance |
RetrievalImportance |
Disarankan | Topikalitas |
FreshnessOptions |
FreshnessOptions |
Opsional | Keaktualan |
Setelan pengindeksan
| Setelan | Lokasi | Rekomendasi | Detail |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Disarankan | Keaktualan |
contentLanguage |
ItemMetadata |
Disarankan | Bahasa item |
owners |
ItemAcl |
Disarankan | Kepemilikan item |
| Sinonim kustom | _dictionaryEntry |
Disarankan | Menggunakan sinonim |
quality |
SearchQualityMetadata |
Opsional | Memengaruhi kualitas |
| Data interaksi | interaction |
Opsional | Interaksi item |
OrderedRanking |
OrderedRanking |
Opsional | Jenis kolom |
Setelan aplikasi penelusuran
| Setelan | Lokasi | Rekomendasi | Detail |
|---|---|---|---|
| Menonaktifkan personalisasi | ScoringConfig |
Disarankan | Personalisasi |
| Tingkat kepentingan sumber | SourceCrowdingConfig |
Opsional | Konfigurasi sumber |
| Crowding | SourceCrowdingConfig |
Opsional | Konfigurasi sumber |