หมายเหตุ: การกำหนดเว็บไซต์ที่จะค้นหา

หน้านี้จะอธิบายวิธีกำหนดความครอบคลุมของเครื่องมือค้นหาของคุณโดยใช้ไฟล์คำอธิบายประกอบ XML

  1. Overview
  2. การใช้รูปแบบ XML ของ Programmable Search
  3. การปรับปรุงการครอบคลุมของ Search
  4. ขีดจำกัดของคำอธิบายประกอบ

ภาพรวม

การจัดการเว็บไซต์จำนวนมากอาจเป็นเรื่องน่าเบื่อหากคุณกำลังสร้างเครื่องมือค้นหาขนาดใหญ่ แต่คุณสามารถเพิ่มและจัดการไซต์จำนวนมากได้โดยแสดงไซต์เหล่านั้นในไฟล์คำอธิบายประกอบและอัปโหลด นอกจากนี้ ไฟล์คำอธิบายประกอบยังช่วยให้คุณควบคุมการจัดอันดับผลการค้นหาได้ดีขึ้นมาก

ไฟล์คำอธิบายประกอบก็คือรายการคำอธิบายประกอบนั่นเอง คำอธิบายประกอบแต่ละรายการมีองค์ประกอบ 2 ส่วน ได้แก่ เว็บไซต์และป้ายกำกับที่เกี่ยวข้อง ป้ายกำกับบอก Programmable Search Engine เกี่ยวกับวิธีจัดการเว็บไซต์ นั่นคือ ควรรวม ยกเว้น โปรโมต หรือลดระดับเว็บไซต์หรือไม่ ในไฟล์บริบท ให้ระบุป้ายกำกับ ในไฟล์คำอธิบายประกอบ คุณสามารถแท็กเว็บไซต์ต่างๆ ด้วยป้ายกำกับที่เหมาะสม

เมื่อคุณเริ่มแก้ไขไฟล์คำอธิบายประกอบ ให้เริ่มต้นด้วยคำอธิบายประกอบจำนวนเล็กน้อย การทดสอบและแก้ปัญหาเครื่องมือค้นหาทำได้ง่ายกว่าด้วยคำอธิบายประกอบจำนวนหนึ่ง เมื่อได้ผลลัพธ์ตามที่คาดหวังไว้ ให้เพิ่มคำอธิบายประกอบทีละน้อย

คุณสามารถอัปโหลดไฟล์คำอธิบายประกอบไปยังแผงควบคุมได้ สำหรับรายละเอียดเกี่ยวกับขีดจำกัดของไฟล์ โปรดดูที่ส่วนขีดจำกัดของคำอธิบายประกอบ

กลับไปด้านบน

การใช้รูปแบบ XML ของ Programmable Search

หากต้องการใช้ประโยชน์จากฟีเจอร์ทั้งหมดที่มีอยู่ในไฟล์การกำหนดค่า Programmable Search Engine คุณควรใช้ XML

หมายเหตุ XML

ต่อไปนี้เป็นตัวอย่างของคำอธิบายประกอบ XML ไฟล์คำอธิบายประกอบนี้จะบอกให้ Programmable Search Engine รวมทุกอย่างใน www.webmd.com/hw/* แต่ยกเว้นทุกอย่างใน www.webmd.com/hw/cancer/*

<Annotations>
  <Annotation about="www.cancer.gov/cancertopics/types/liver/*">
    <Label name="_include_"/>
    <Comment>government site</Comment>
  </Annotation>
  <Annotation about="www.medicinenet.com/liver_cancer/">
    <Label name="_exclude_"/>
    <Comment>site on symptoms</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/*">
    <Label name="_include_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/cancer/*">
    <Label name="_exclude_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.oncologychannel.com/*/treatment">
    <Label name="_exclude_"/>
  </Annotation>
</Annotations>

ไฟล์คำอธิบายประกอบมีองค์ประกอบ 4 อย่างในลำดับชั้นต่อไปนี้

  • Annotations (องค์ประกอบราก)
    • Annotation
      • Label
      • Comment (ไม่บังคับ)

กลับไปด้านบน

การสร้างคำอธิบายประกอบภายนอก

ในการระบุรายชื่อเว็บไซต์ที่ต้องการให้เครื่องมือค้นหาครอบคลุม ให้ทำดังนี้

  1. เริ่มต้นไฟล์ด้วยองค์ประกอบรูท <Annotations></Annotations>
  2. สร้างคำอธิบายประกอบด้วยการเพิ่มแท็ก <Annotation></Annotation> แล้วกำหนดแอตทริบิวต์ about ด้วยรูปแบบ URL ของเว็บไซต์
    <Annotations>
       <Annotation about="www.webmd.com/hw/cancer/*">
       </Annotation>
       </Annotations>
    
  3. เชื่อมโยงเว็บไซต์กับเครื่องมือค้นหาโดยใช้แท็ก <Label name=" "/> และระบุวิธีที่เครื่องมือค้นหาควรปฏิบัติต่อเว็บไซต์ดังกล่าว คุณสามารถรับป้ายกำกับสำหรับเครื่องมือค้นหาจากไฟล์บริบทของเครื่องมือค้นหา คุณจะเห็นป้ายกำกับ 2 ป้าย ป้ายแรกสำหรับเพิ่มเว็บไซต์ลงใน Programmable Search Engine ส่วนอีกป้ายสำหรับยกเว้นเว็บไซต์ หากคุณไม่ได้เปลี่ยนชื่อป้ายกำกับเครื่องมือค้นหาในไฟล์บริบท ป้ายกำกับสำหรับการรวมเว็บไซต์จะอยู่ในรูปแบบ _include_ และป้ายกำกับสำหรับการยกเว้นเว็บไซต์อยู่ในรูปแบบ _exclude_ เพื่อหลีกเลี่ยงข้อผิดพลาด ให้คัดลอกและวางป้ายกำกับเหล่านี้แทนการพิมพ์ด้วยตัวเอง
       <Annotations>
       <Annotation about="http://www.solarenergy.org/*">
         <Label name="_include_"/>
       </Annotation>
    </Annotations>
    

    เว็บไซต์หนึ่งอาจมีป้ายกำกับหลายป้าย ที่เกี่ยวข้อง

    หากคุณเปลี่ยนชื่อป้ายกำกับในไฟล์บริบท อย่าลืมอัปเดตค่า Label name ในไฟล์คำอธิบายประกอบ

  4. หากต้องการเพิ่มเว็บไซต์ ให้สร้างและกำหนดเอลิเมนต์ Annotation อื่น
  5. บันทึกไฟล์ XML

กลับไปด้านบน

การปรับปรุงการครอบคลุมของการค้นหา

Programmable Search Engine สร้างขึ้นที่ด้านบนของดัชนีของ Google ซึ่งหมายความว่าหน้าเว็บที่อยู่ในดัชนีของ Google จะพร้อมใช้งานสำหรับเครื่องมือค้นหาของคุณ ในทางกลับกัน หน้าเว็บที่ Google ยังไม่ได้ทำการ Crawl ก็จะไม่แสดงในผลการค้นหา หากคุณต้องการให้ Programmable Search Engine รวมเว็บไซต์ที่ตอนนี้ไม่ได้อยู่ในดัชนีของ Google ให้ส่งแผนผังไซต์ไปยัง Google Search Console

Sitemap ประกอบด้วยรายการหน้าเว็บในเว็บไซต์ของคุณ รวมถึงข้อมูลเกี่ยวกับความถี่ในการอัปเดตหน้าเว็บและความสำคัญของหน้าเว็บที่เกี่ยวข้องกัน การส่ง Sitemap จะช่วยให้ Google ค้นพบหน้าเว็บของคุณและปรับปรุงกำหนดการรวบรวมข้อมูลได้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Sitemap โปรดดูศูนย์ช่วยเหลือสำหรับผู้ดูแลเว็บ และการใช้โปรโตคอล Sitemap หากคุณสนใจสร้าง Sitemap ที่ดีกว่าเดิม โปรดดู http://www.sitemaps.org/protocol.php

การส่ง Sitemap มีประโยชน์อย่างยิ่งหากเว็บไซต์ของคุณมีสิ่งต่อไปนี้

  • เนื้อหาแบบไดนามิก
  • หน้าเว็บที่ Googlebot (โปรแกรมรวบรวมข้อมูลเว็บของ Google) ค้นพบได้ยาก เช่น หน้าเว็บที่มีฟีเจอร์ AJAX หรือ Flash แบบสมบูรณ์
  • เว็บไซต์ไม่มากที่ลิงก์กับเว็บไซต์ดังกล่าว

    Googlebot จะรวบรวมข้อมูลเว็บโดยติดตามลิงก์จากหน้าหนึ่งไปยังอีกหน้าหนึ่ง ดังนั้นหากเว็บไซต์ของคุณไม่มีการเชื่อมโยงที่ดี โปรแกรมรวบรวมข้อมูลจะค้นพบได้ยาก หากเว็บไซต์ของคุณเป็นเว็บไซต์ใหม่ อาจเป็นเพราะมีจำนวนเว็บไซต์ที่นำไปยังเว็บไซต์ของคุณ

  • ที่เก็บถาวรของหน้าเนื้อหาขนาดใหญ่ซึ่งไม่มีเครือข่ายลิงก์ข้ามที่แข็งแกร่ง

Google จัดทำดัชนีได้เฉพาะหน้าเว็บที่มีสิทธิ์เข้าถึงเท่านั้น ดังนั้น หากคุณใช้ไฟล์ robots.txt หรือเมตาแท็ก robots ในหน้าเว็บ โปรดตรวจสอบว่าหน้าเว็บเหล่านั้นไม่ได้บล็อกโปรแกรมรวบรวมข้อมูล

ความครอบคลุมที่ได้รับการปรับปรุงจะไม่เกิดขึ้นทันที เนื่องจากหน้าเว็บต้องใช้เวลาสักพักในการรวบรวมข้อมูลและจัดทำดัชนี แต่เมื่อหน้าเว็บอยู่ในดัชนีแล้ว หน้าเว็บเหล่านั้นสามารถปรากฏทั้งใน Google Search และ Programmable Search Engine ได้

กลับไปด้านบน

ขีดจำกัดของคำอธิบายประกอบ

ตารางต่อไปนี้แสดงขีดจำกัดของไฟล์คำอธิบายประกอบที่อัปโหลดไปยัง Programmable Search Engine

หมายเหตุ: ปฏิบัติตามขีดจำกัดอย่างเคร่งครัด หากมีข้อความค้นหาเกินจำนวน เครื่องมือค้นหาของคุณอาจไม่แสดงผลลัพธ์

อัตราส่วน ขีดจำกัด
ขนาดไฟล์ (ไฟล์บริบทหรือคำอธิบายประกอบ) 30KB
จำนวนคำอธิบายประกอบสูงสุดต่อเครื่องมือค้นหา 5,000

เคล็ดลับ: หากพบว่าเครื่องมือค้นหาเพิ่มจำนวนเว็บไซต์สูงสุดถึง 5,000 เว็บไซต์ ให้ลองรวม URL แต่ละรายการเป็นรูปแบบ URL

กลับไปด้านบน