ปรับปรุงคุณภาพการค้นหา

คุณภาพการค้นหาหมายถึงคุณภาพของผลการค้นหาในแง่ของการจัดอันดับและการเรียกคืนตามที่ผู้ใช้รับรู้

การจัดอันดับคือลำดับของรายการ และการเรียกคืนคือจำนวนรายการที่เกี่ยวข้อง ที่ดึงข้อมูลมา รายการ (หรือเอกสาร) คือเนื้อหาดิจิทัลใดๆ ที่ Google Cloud Search จัดทำดัชนีได้ เช่น เอกสาร Microsoft Office, ไฟล์ PDF, แถวในฐานข้อมูล หรือ URL ที่ไม่ซ้ำกัน รายการประกอบด้วย

  • ข้อมูลเมตาที่มีโครงสร้าง
  • เนื้อหาที่จัดทำดัชนีได้
  • ACL

Cloud Search ใช้สัญญาณต่างๆ เพื่อดึงและจัดอันดับผลการค้นหา คุณมีอิทธิพลต่อสัญญาณเหล่านี้ได้ผ่านการตั้งค่าในสคีมา เนื้อหารายการ และ ข้อมูลเมตา รวมถึงแอปพลิเคชันการค้นหา เอกสารนี้ช่วยปรับปรุงคุณภาพการค้นหาโดยการแก้ไขปัจจัยที่มีอิทธิพลต่อสัญญาณเหล่านี้

ดูสรุปการตั้งค่าได้ที่สรุปการตั้งค่าคุณภาพการค้นหา

มีผลต่อคะแนนความเกี่ยวข้องตามหัวข้อ

ความเกี่ยวข้องตามหัวข้อคือความเกี่ยวข้องของผลการค้นหากับคำค้นหา Cloud Search จะคำนวณหัวข้อที่ได้รับความสนใจในขณะนั้นโดยอิงตามข้อมูลต่อไปนี้

  • ความสำคัญของคำค้นหาแต่ละคำ
  • จำนวนการเข้าชม (ความถี่ที่คำค้นหาปรากฏในเนื้อหาหรือข้อมูลเมตา)
  • ประเภทการทำงานของคีย์เวิร์ดระหว่างคำค้นหากับรายการที่จัดทำดัชนี

หากต้องการส่งผลต่อคะแนนความเกี่ยวข้องตามหัวข้อของพร็อพเพอร์ตี้ข้อความ ให้กำหนด RetrievalImportance ในสคีมา การจับคู่ที่พักที่มีผลลัพธ์ RetrievalImportance สูงจะส่งผลให้ได้คะแนนสูงขึ้น

ตัวอย่างเช่น หากคุณจัดเก็บประวัติข้อบกพร่องของซอฟต์แวร์ ผู้ใช้อาจค้นหาตามชื่อข้อบกพร่อง ตั้งค่า RetrievalImportance สำหรับชื่อเป็น HIGHEST สำหรับคำอธิบาย ให้ใช้ DEFAULT

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

สำหรับเอกสาร HTML แท็กอย่าง <title> และ <h1> จะช่วยกำหนดความสำคัญของคำ หาก ContentFormat เป็น TEXT ItemContent จะใช้ความสำคัญ DEFAULT หากเป็น HTML ความสำคัญจะขึ้นอยู่กับพร็อพเพอร์ตี้ HTML

ความใหม่ของอิทธิพล

ความใหม่จะวัดว่ามีการแก้ไขรายการเมื่อเร็วๆ นี้หรือไม่ โดยใช้ createTime และ updateTime ใน ItemMetadata รายการที่เก่ากว่าจะได้รับการจัดอันดับต่ำกว่า

คุณมีอิทธิพลต่อความใหม่ได้โดยการปรับ freshnessProperty และ freshnessDuration ใน FreshnessOptions freshnessProperty ช่วยให้คุณใช้การประทับเวลาหรือวันที่ที่กำหนดเองแทน updateTime ได้ สำหรับข้อบกพร่อง คุณอาจใช้กำหนดเวลาเพื่อให้รายการที่มีวันที่ใกล้เคียงกับ ปัจจุบันได้รับการจัดอันดับสูงขึ้น

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

ใช้ freshnessDuration เพื่อระบุว่าเมื่อใดที่ระบบจะถือว่าสินค้าล้าสมัย ค่าที่สูง เช่น 100 ปี จะลบล้างเอฟเฟกต์ความสดใหม่ ซึ่งจะเป็นประโยชน์สำหรับข้อมูลแบบคงที่ เช่น โปรไฟล์พนักงาน สำหรับข่าว ให้ใช้ค่าเล็กๆ เช่น 3 วัน

คุณภาพของอินฟลูเอนเซอร์

คุณภาพจะวัดความถูกต้องและประโยชน์ของรายการ ระบุค่าระหว่าง 0 ถึง 1 โดยใช้ SearchQualityMetadata ค่าที่สูงขึ้นจะช่วยเพิ่มอันดับ ตัวอย่างเช่น คุณอาจเพิ่มเอกสารสิทธิประโยชน์ ที่เขียนโดยฝ่ายทรัพยากรบุคคล

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

อิทธิพลโดยใช้ประเภทฟิลด์

คุณมีอิทธิพลต่อการจัดอันดับตามพร็อพเพอร์ตี้ Enum หรือจำนวนเต็มได้โดยใช้ OrderedRanking ดังนี้

  • NO_ORDER (ค่าเริ่มต้น): ไม่มีผลต่อการจัดอันดับ
  • ASCENDING: ค่าที่สูงขึ้นจะช่วยเพิ่มอันดับ
  • DESCENDING: ค่าที่ต่ำกว่าจะช่วยเพิ่มอันดับ

สำหรับลำดับความสำคัญของข้อบกพร่อง ให้ใช้ DESCENDING หาก HIGH เป็น 1 และ LOW เป็น 3 สําหรับพร็อพเพอร์ตี้ votes ให้ใช้ ASCENDING

มีอิทธิพลต่อการจัดอันดับผ่านการขยายการค้นหา

การขยายการค้นหาใช้คำพ้องความหมายและการสะกดคำเพื่อปรับปรุงผลลัพธ์

ใช้คำพ้อง

Cloud Search ใช้เนื้อหาเว็บสาธารณะสำหรับคำพ้องความหมาย นอกจากนี้ คุณยัง กำหนดคำพ้องความหมายที่กำหนดเองสำหรับคำศัพท์เฉพาะขององค์กรได้ด้วย ดูกำหนดคำพ้องความหมาย

ใช้การสะกด

Cloud Search จะให้คำแนะนำการสะกดในSpellResult นอกจากนี้ยังใช้การแก้ไขการสะกดคำเป็นคำพ้องความหมายเพื่อค้นหาเอกสารด้วย

มีอิทธิพลต่อการจัดอันดับผ่านการตั้งค่าแอปพลิเคชัน Search

แอปพลิเคชันค้นหาจะให้ข้อมูลตามบริบท คุณมีอิทธิพลต่อการจัดอันดับได้ โดยใช้การตั้งค่าต่อไปนี้

ปรับการกำหนดค่าการให้คะแนน

ระบุ ScoringConfig เพื่อปิดใช้ความใหม่หรือการปรับเปลี่ยนในแบบของคุณ การปิดใช้การปรับเปลี่ยนในแบบของคุณจะนำการเพิ่มเจ้าของและการโต้ตอบออก ดูปรับแต่งประสบการณ์การค้นหา

ปรับการกำหนดค่าแหล่งที่มา

ระบุการตั้งค่าระดับแหล่งข้อมูล

  • ความสำคัญของแหล่งที่มา: รายการจากแหล่งที่มาที่มีความสำคัญ HIGH จะได้รับการจัดอันดับสูงกว่า
  • การจำกัดจำนวนผลการค้นหาจากแหล่งที่มาเดียว: จำกัดผลการค้นหาจากแหล่งที่มาเดียว (ค่าเริ่มต้นคือ 3) เพื่อให้มั่นใจว่า มีความหลากหลาย

การปรับเปลี่ยนในแบบของคุณ

การปรับเปลี่ยนในแบบของคุณจะจัดลำดับความสำคัญของผลลัพธ์ตามผู้ใช้ ดังนี้

  • การเป็นเจ้าของไอเทม: เพิ่มไอเทมที่ผู้ใช้เป็นเจ้าของ
  • การโต้ตอบกับรายการ: เพิ่มรายการที่ผู้ใช้ดู แก้ไข หรือแสดงความคิดเห็นล่าสุด
  • ผู้ใช้คลิก: เพิ่มรายการที่ผู้ใช้คลิกก่อนหน้านี้ อย่าแก้ไข URL ของผลลัพธ์ เนื่องจากระบบใช้ URL นี้เพื่อรวบรวมข้อมูล

การตีความคำค้นหา

ฟีเจอร์การตีความคำค้นหาจะแปลงคำค้นหาของผู้ใช้เป็นคำค้นหาที่มีโครงสร้างซึ่งอิงตามโอเปอเรเตอร์โดยใช้คำจำกัดความของสคีมา ซึ่งจะให้ผลลัพธ์ที่แม่นยำ แม้จะมีคีย์เวิร์ดน้อยก็ตาม ดูจัดโครงสร้างสคีมาเพื่อการตีความคำค้นหาที่เหมาะสมที่สุด

ภาษาของสินค้า

Cloud Search จะลดระดับรายการที่มีภาษาไม่ตรงกับภาษาของคำค้นหา ตั้งค่า languageCode ใน RequestOptions ตามค่ากำหนดของผู้ใช้

บริบทของรายการ

ใช้ contextAttributes เพื่อเพิ่มอันดับของรายการที่เกี่ยวข้องกับบริบทของคำค้นหา เช่น สถานที่หรือ แผนก

ความนิยมของไอเทม

Cloud Search จะเพิ่มรายการที่ผู้ใช้คลิกบ่อยๆ ในคำค้นหาล่าสุด อย่าแก้ไข URL ของผลการค้นหา เนื่องจากระบบใช้ URL เหล่านี้เพื่อติดตามการคลิก

สรุปการตั้งค่าคุณภาพการค้นหา

ตารางต่อไปนี้จะแสดงข้อมูลสรุปของการตั้งค่าคุณภาพการค้นหา

การตั้งค่าสคีมา

การตั้งค่า ตำแหน่ง คำแนะนำ รายละเอียด
ItemContent ItemContent แนะนำ ความเกี่ยวข้องกับหัวข้อ
RetrievalImportance RetrievalImportance แนะนำ ความเกี่ยวข้องกับหัวข้อ
FreshnessOptions FreshnessOptions ไม่บังคับ ความสดใหม่

การตั้งค่าการจัดทำดัชนี

การตั้งค่า ตำแหน่ง คำแนะนำ รายละเอียด
createTime/updateTime ItemMetadata แนะนำ ความสดใหม่
contentLanguage ItemMetadata แนะนำ ภาษาของสินค้า
owners ItemAcl แนะนำ การเป็นเจ้าของรายการ
คำพ้องความหมายที่กำหนดเอง _dictionaryEntry แนะนำ ใช้คำพ้องความหมาย
quality SearchQualityMetadata ไม่บังคับ คุณภาพของอินฟลูเอนเซอร์
ข้อมูลการติดต่อ interaction ไม่บังคับ การโต้ตอบกับสินค้า
OrderedRanking OrderedRanking ไม่บังคับ ประเภทฟิลด์

การตั้งค่าแอปพลิเคชันการค้นหา

การตั้งค่า ตำแหน่ง คำแนะนำ รายละเอียด
ปิดใช้งานการปรับเปลี่ยนในแบบของคุณ ScoringConfig แนะนำ การปรับเปลี่ยนในแบบของคุณ
ความสำคัญของแหล่งที่มา SourceCrowdingConfig ไม่บังคับ การกำหนดค่าแหล่งข้อมูล
การกำหนดจำนวน SourceCrowdingConfig ไม่บังคับ การกำหนดค่าแหล่งข้อมูล

ขั้นตอนถัดไป

  1. จัดโครงสร้างสคีมาเพื่อการตีความคำค้นหาที่เหมาะสมที่สุด
  2. กำหนดคำพ้องความหมาย