หน้านี้จะอธิบายวิธีกำหนดความครอบคลุมของเครื่องมือค้นหาของคุณโดยใช้ไฟล์คำอธิบายประกอบ XML
- Overview
- การใช้รูปแบบ XML ของ Programmable Search
- การปรับปรุงการครอบคลุมของ Search
- ขีดจำกัดของคำอธิบายประกอบ
ภาพรวม
การจัดการเว็บไซต์จำนวนมากอาจเป็นเรื่องน่าเบื่อหากคุณกำลังสร้างเครื่องมือค้นหาขนาดใหญ่ แต่คุณสามารถเพิ่มและจัดการไซต์จำนวนมากได้โดยแสดงไซต์เหล่านั้นในไฟล์คำอธิบายประกอบและอัปโหลด นอกจากนี้ ไฟล์คำอธิบายประกอบยังช่วยให้คุณควบคุมการจัดอันดับผลการค้นหาได้ดีขึ้นมาก
ไฟล์คำอธิบายประกอบก็คือรายการคำอธิบายประกอบนั่นเอง คำอธิบายประกอบแต่ละรายการมีองค์ประกอบ 2 ส่วน ได้แก่ เว็บไซต์และป้ายกำกับที่เกี่ยวข้อง ป้ายกำกับบอก Programmable Search Engine เกี่ยวกับวิธีจัดการเว็บไซต์ นั่นคือ ควรรวม ยกเว้น โปรโมต หรือลดระดับเว็บไซต์หรือไม่ ในไฟล์บริบท ให้ระบุป้ายกำกับ ในไฟล์คำอธิบายประกอบ คุณสามารถแท็กเว็บไซต์ต่างๆ ด้วยป้ายกำกับที่เหมาะสม
เมื่อคุณเริ่มแก้ไขไฟล์คำอธิบายประกอบ ให้เริ่มต้นด้วยคำอธิบายประกอบจำนวนเล็กน้อย การทดสอบและแก้ปัญหาเครื่องมือค้นหาทำได้ง่ายกว่าด้วยคำอธิบายประกอบจำนวนหนึ่ง เมื่อได้ผลลัพธ์ตามที่คาดหวังไว้ ให้เพิ่มคำอธิบายประกอบทีละน้อย
คุณสามารถอัปโหลดไฟล์คำอธิบายประกอบไปยังแผงควบคุมได้ สำหรับรายละเอียดเกี่ยวกับขีดจำกัดของไฟล์ โปรดดูที่ส่วนขีดจำกัดของคำอธิบายประกอบ
การใช้รูปแบบ XML ของ Programmable Search
หากต้องการใช้ประโยชน์จากฟีเจอร์ทั้งหมดที่มีอยู่ในไฟล์การกำหนดค่า Programmable Search Engine คุณควรใช้ XML
หมายเหตุ XML
ต่อไปนี้เป็นตัวอย่างของคำอธิบายประกอบ XML ไฟล์คำอธิบายประกอบนี้จะบอกให้ Programmable Search Engine รวมทุกอย่างใน www.webmd.com/hw/* แต่ยกเว้นทุกอย่างใน www.webmd.com/hw/cancer/*
<Annotations> <Annotation about="www.cancer.gov/cancertopics/types/liver/*"> <Label name="_include_"/> <Comment>government site</Comment> </Annotation> <Annotation about="www.medicinenet.com/liver_cancer/"> <Label name="_exclude_"/> <Comment>site on symptoms</Comment> </Annotation> <Annotation about="www.webmd.com/hw/*"> <Label name="_include_"/> <Comment>great sites for patients!</Comment> </Annotation> <Annotation about="www.webmd.com/hw/cancer/*"> <Label name="_exclude_"/> <Comment>great sites for patients!</Comment> </Annotation> <Annotation about="www.oncologychannel.com/*/treatment"> <Label name="_exclude_"/> </Annotation> </Annotations>
ไฟล์คำอธิบายประกอบมีองค์ประกอบ 4 อย่างในลำดับชั้นต่อไปนี้
-
Annotations
(องค์ประกอบราก)Annotation
Label
Comment
(ไม่บังคับ)
การสร้างคำอธิบายประกอบภายนอก
ในการระบุรายชื่อเว็บไซต์ที่ต้องการให้เครื่องมือค้นหาครอบคลุม ให้ทำดังนี้
- เริ่มต้นไฟล์ด้วยองค์ประกอบรูท
<Annotations></Annotations>
- สร้างคำอธิบายประกอบด้วยการเพิ่มแท็ก
<Annotation></Annotation>
แล้วกำหนดแอตทริบิวต์about
ด้วยรูปแบบ URL ของเว็บไซต์<Annotations> <Annotation about="www.webmd.com/hw/cancer/*"> </Annotation> </Annotations>
- เชื่อมโยงเว็บไซต์กับเครื่องมือค้นหาโดยใช้แท็ก
<Label name=" "/>
และระบุวิธีที่เครื่องมือค้นหาควรปฏิบัติต่อเว็บไซต์ดังกล่าว คุณสามารถรับป้ายกำกับสำหรับเครื่องมือค้นหาจากไฟล์บริบทของเครื่องมือค้นหา คุณจะเห็นป้ายกำกับ 2 ป้าย ป้ายแรกสำหรับเพิ่มเว็บไซต์ลงใน Programmable Search Engine ส่วนอีกป้ายสำหรับยกเว้นเว็บไซต์ หากคุณไม่ได้เปลี่ยนชื่อป้ายกำกับเครื่องมือค้นหาในไฟล์บริบท ป้ายกำกับสำหรับการรวมเว็บไซต์จะอยู่ในรูปแบบ_include_
และป้ายกำกับสำหรับการยกเว้นเว็บไซต์อยู่ในรูปแบบ_exclude_
เพื่อหลีกเลี่ยงข้อผิดพลาด ให้คัดลอกและวางป้ายกำกับเหล่านี้แทนการพิมพ์ด้วยตัวเอง<Annotations> <Annotation about="http://www.solarenergy.org/*"> <Label name="_include_"/> </Annotation> </Annotations>
เว็บไซต์หนึ่งอาจมีป้ายกำกับหลายป้าย ที่เกี่ยวข้อง
หากคุณเปลี่ยนชื่อป้ายกำกับในไฟล์บริบท อย่าลืมอัปเดตค่า
Label name
ในไฟล์คำอธิบายประกอบ - หากต้องการเพิ่มเว็บไซต์ ให้สร้างและกำหนดเอลิเมนต์
Annotation
อื่น - บันทึกไฟล์ XML
การปรับปรุงการครอบคลุมของการค้นหา
Programmable Search Engine สร้างขึ้นที่ด้านบนของดัชนีของ Google ซึ่งหมายความว่าหน้าเว็บที่อยู่ในดัชนีของ Google จะพร้อมใช้งานสำหรับเครื่องมือค้นหาของคุณ ในทางกลับกัน หน้าเว็บที่ Google ยังไม่ได้ทำการ Crawl ก็จะไม่แสดงในผลการค้นหา หากคุณต้องการให้ Programmable Search Engine รวมเว็บไซต์ที่ตอนนี้ไม่ได้อยู่ในดัชนีของ Google ให้ส่งแผนผังไซต์ไปยัง Google Search Console
Sitemap ประกอบด้วยรายการหน้าเว็บในเว็บไซต์ของคุณ รวมถึงข้อมูลเกี่ยวกับความถี่ในการอัปเดตหน้าเว็บและความสำคัญของหน้าเว็บที่เกี่ยวข้องกัน การส่ง Sitemap จะช่วยให้ Google ค้นพบหน้าเว็บของคุณและปรับปรุงกำหนดการรวบรวมข้อมูลได้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Sitemap โปรดดูศูนย์ช่วยเหลือสำหรับผู้ดูแลเว็บ และการใช้โปรโตคอล Sitemap หากคุณสนใจสร้าง Sitemap ที่ดีกว่าเดิม โปรดดู http://www.sitemaps.org/protocol.php
การส่ง Sitemap มีประโยชน์อย่างยิ่งหากเว็บไซต์ของคุณมีสิ่งต่อไปนี้
- เนื้อหาแบบไดนามิก
- หน้าเว็บที่ Googlebot (โปรแกรมรวบรวมข้อมูลเว็บของ Google) ค้นพบได้ยาก เช่น หน้าเว็บที่มีฟีเจอร์ AJAX หรือ Flash แบบสมบูรณ์
- เว็บไซต์ไม่มากที่ลิงก์กับเว็บไซต์ดังกล่าว
Googlebot จะรวบรวมข้อมูลเว็บโดยติดตามลิงก์จากหน้าหนึ่งไปยังอีกหน้าหนึ่ง ดังนั้นหากเว็บไซต์ของคุณไม่มีการเชื่อมโยงที่ดี โปรแกรมรวบรวมข้อมูลจะค้นพบได้ยาก หากเว็บไซต์ของคุณเป็นเว็บไซต์ใหม่ อาจเป็นเพราะมีจำนวนเว็บไซต์ที่นำไปยังเว็บไซต์ของคุณ
- ที่เก็บถาวรของหน้าเนื้อหาขนาดใหญ่ซึ่งไม่มีเครือข่ายลิงก์ข้ามที่แข็งแกร่ง
Google จัดทำดัชนีได้เฉพาะหน้าเว็บที่มีสิทธิ์เข้าถึงเท่านั้น ดังนั้น หากคุณใช้ไฟล์ robots.txt หรือเมตาแท็ก robots ในหน้าเว็บ โปรดตรวจสอบว่าหน้าเว็บเหล่านั้นไม่ได้บล็อกโปรแกรมรวบรวมข้อมูล
ความครอบคลุมที่ได้รับการปรับปรุงจะไม่เกิดขึ้นทันที เนื่องจากหน้าเว็บต้องใช้เวลาสักพักในการรวบรวมข้อมูลและจัดทำดัชนี แต่เมื่อหน้าเว็บอยู่ในดัชนีแล้ว หน้าเว็บเหล่านั้นสามารถปรากฏทั้งใน Google Search และ Programmable Search Engine ได้
ขีดจำกัดของคำอธิบายประกอบ
ตารางต่อไปนี้แสดงขีดจำกัดของไฟล์คำอธิบายประกอบที่อัปโหลดไปยัง Programmable Search Engine
หมายเหตุ: ปฏิบัติตามขีดจำกัดอย่างเคร่งครัด หากมีข้อความค้นหาเกินจำนวน เครื่องมือค้นหาของคุณอาจไม่แสดงผลลัพธ์
อัตราส่วน | ขีดจำกัด |
---|---|
ขนาดไฟล์ (ไฟล์บริบทหรือคำอธิบายประกอบ) | 30KB |
จำนวนคำอธิบายประกอบสูงสุดต่อเครื่องมือค้นหา | 5,000
เคล็ดลับ: หากพบว่าเครื่องมือค้นหาเพิ่มจำนวนเว็บไซต์สูงสุดถึง 5,000 เว็บไซต์ ให้ลองรวม URL แต่ละรายการเป็นรูปแบบ URL |