หน้านี้จะอธิบายวิธีสร้างแผนผังเว็บไซต์และทำให้ใช้งานกับ Google ได้ ดูข้อมูลเพิ่มเติมเกี่ยวกับแผนผังเว็บไซต์
- เลือกหน้าในเว็บไซต์ที่ควรให้ Google รวบรวมข้อมูล และกำหนดเวอร์ชัน Canonical ของแต่ละหน้า
- เลือกรูปแบบแผนผังเว็บไซต์ที่คุณต้องการใช้ คุณสร้างแผนผังเว็บไซต์ได้ด้วยตนเองหรือจะเลือกจากเครื่องมือของบุคคลที่สามซึ่งมีอยู่หลายรายการเพื่อสร้างแผนผังเว็บไซต์ก็ได้
- ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google โดยเพิ่มไปยังไฟล์ robots.txt หรือส่งไปที่ Search Console โดยตรง
รูปแบบแผนผังเว็บไซต์
Google รองรับแผนผังเว็บไซต์รูปแบบต่างๆ ตามที่อธิบายไว้ที่นี่ และทุกรูปแบบควรมีโปรโตคอลแผนผังเว็บไซต์มาตรฐาน ปัจจุบัน Google ไม่ได้ใช้แอตทริบิวต์ <priority>
ในแผนผังเว็บไซต์
ทุกรูปแบบจะจำกัดขนาดแผนผังเว็บไซต์เดี่ยวอยู่ที่ 50 MB (ไม่บีบอัด) และ URL 50,000 รายการ หากมีไฟล์ขนาดใหญ่กว่านี้หรือมี URL มากกว่านี้ จะต้องแยกแผนผังเว็บไซต์ออกเป็นหลายๆ รายการ คุณสร้างไฟล์ดัชนีแผนผังเว็บไซต์ (ไฟล์ที่ชี้ไปยังรายการแผนผังเว็บไซต์) และส่งไฟล์ดัชนีไฟล์เดียวนั้นไปยัง Google ได้หากต้องการ หรือจะส่งแผนผังเว็บไซต์หลายรายการและ/หรือไฟล์ดัชนีแผนผังเว็บไซต์หลายไฟล์ไปยัง Google ก็ได้
XML
ต่อไปนี้คือแผนผังเว็บไซต์ XML พื้นฐานที่สุดที่มีตำแหน่งของ URL เดี่ยว
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/foo.html</loc> <lastmod>2018-06-04</lastmod> </url> </urlset>
ดูตัวอย่างที่ซับซ้อนมากขึ้นและเอกสารประกอบฉบับเต็มได้ที่ sitemaps.org
ดูตัวอย่างแผนผังเว็บไซต์ที่ระบุหน้าภาษาอื่นและแผนผังเว็บไซต์สำหรับไฟล์ข่าว รูปภาพ หรือวิดีโอได้
RSS, mRSS และ Atom 1.0
หากมีบล็อกที่มีฟีด RSS หรือ Atom ก็ส่ง URL ของฟีดเป็นแผนผังเว็บไซต์ได้ ซอฟต์แวร์บล็อกส่วนใหญ่สร้างฟีดให้คุณได้ แต่โปรดทราบว่าฟีดนี้ให้ข้อมูลเกี่ยวกับ URL ล่าสุดเท่านั้น
- Google รับฟีด RSS 2.0 และ Atom 1.0
- คุณใช้ฟีด mRSS (media RSS) เพื่อส่งรายละเอียดเกี่ยวกับเนื้อหาวิดีโอในเว็บไซต์ให้ Google ได้
ข้อความ
หากแผนผังเว็บไซต์มีเฉพาะ URL ของหน้าเว็บ คุณส่งไฟล์ข้อความธรรมดาที่มี 1 URL ต่อบรรทัดให้ Google ได้ เช่น
http://www.example.com/file1.html http://www.example.com/file2.html
หลักเกณฑ์สำหรับแผนผังเว็บไซต์แบบไฟล์ข้อความมีดังนี้
- เข้ารหัสไฟล์โดยใช้การเข้ารหัส UTF-8
- ไฟล์ข้อความไม่ควรมีอย่างอื่นนอกจากรายการ URL
- คุณจะตั้งชื่อไฟล์ข้อความว่าอะไรก็ได้ ตราบใดที่ไฟล์นั้นมีนามสกุล .txt (เช่น sitemap.txt)
Google Sites
หากคุณใช้ Google Sites เพื่อสร้างและยืนยันเว็บไซต์ Google Sites จะสร้างแผนผังเว็บไซต์ให้คุณโดยอัตโนมัติ คุณจะแก้ไขแผนผังเว็บไซต์นี้ไม่ได้ แต่ส่งแผนผังเว็บไซต์ไปยัง Google ได้ ในกรณีที่ต้องการอ่านข้อมูลรายงานของแผนผังเว็บไซต์ โปรดทราบว่าแผนผังเว็บไซต์อาจแสดงไม่ถูกต้องหากมีหน้ามากกว่า 1,000 หน้าในไดเรกทอรีย่อยเดียว
- URL ของแผนผังเว็บไซต์จะเป็น
http://sites.google.com/site/yoursitename/system/feeds/sitemap
หากเว็บไซต์โฮสต์อยู่ที่ Google Sites - URL ของแผนผังเว็บไซต์จะเป็น
https://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap
หากคุณสร้างเว็บไซต์โดยใช้ Google Workspace
ส่วนขยายแผนผังเว็บไซต์สำหรับสื่อประเภทอื่นๆ
Google รองรับไวยากรณ์แผนผังเว็บไซต์เพิ่มเติมสำหรับสื่อประเภทต่อไปนี้ โปรดใช้ส่วนขยายเหล่านี้เพื่ออธิบายไฟล์วิดีโอ รูปภาพ และเนื้อหาอื่นๆ ที่ยากต่อการแยกวิเคราะห์ในเว็บไซต์ของคุณเพื่อปรับปรุงการจัดทำดัชนี
หลักเกณฑ์ทั่วไปสำหรับแผนผังเว็บไซต์
- ใช้ URL ที่สอดคล้องกันและอยู่ในรูปแบบเต็ม Google จะรวบรวมข้อมูลจาก URL ตรงตามที่ระบุทุกประการ ตัวอย่างเช่น หากเว็บไซต์อยู่ที่
https://www.example.com/
อย่าระบุ URL เป็นhttps://example.com/
(ไม่มีwww
) หรือ./mypage.html
(URL แบบสัมพัทธ์) - คุณโพสต์แผนผังเว็บไซต์ที่ตำแหน่งใดก็ได้ในเว็บไซต์ แต่แผนผังเว็บไซต์จะมีผลเฉพาะกับไดเรกทอรีที่สืบทอดจากไดเรกทอรีระดับบนสุด ดังนั้น แผนผังเว็บไซต์ที่โพสต์ไว้ที่รูทของเว็บไซต์ซึ่งเป็นตำแหน่งที่เราแนะนำให้โพสต์แผนผังเว็บไซต์นั้นจะมีผลกับทุกไฟล์ในเว็บไซต์
- อย่ารวมรหัสเซสชันจาก URL ในแผนผังเว็บไซต์เพื่อลดการรวบรวมข้อมูล URL เหล่านั้นซ้ำ
- แจ้งให้ Google ทราบเกี่ยวกับเวอร์ชันภาษาทางเลือกของ URL โดยใช้ข้อมูลเสริม hreflang
- ไฟล์แผนผังเว็บไซต์ต้องมีการเข้ารหัส UTF-8 และใช้อักขระหลีกกับ URL อย่างเหมาะสม
- แยกแผนผังเว็บไซต์ขนาดใหญ่เป็นแผนผังเว็บไซต์ขนาดเล็ก โดยขนาดของแผนผังเว็บไซต์สูงสุดคือ URL 50,000 รายการ/50 MB เมื่อไม่ได้บีบอัด ใช้ไฟล์ดัชนีแผนผังเว็บไซต์เพื่อแสดงแผนผังเว็บไซต์ทั้งหมดและส่งไฟล์เดี่ยวนี้ไปยัง Google แทนการส่งแผนผังเว็บไซต์แต่ละรายการ
- แสดงเฉพาะ Canonical URL ในแผนผังเว็บไซต์ หากคุณมีหน้าเว็บ 2 เวอร์ชัน ให้แสดงเฉพาะหน้า Canonical (ที่ Google เลือก) ในแผนผังเว็บไซต์ หากคุณมีเว็บไซต์ 2 เวอร์ชัน (เช่น มี www และไม่มี www) ให้ตัดสินใจว่าจะใช้เว็บไซต์ใดเป็นหลัก แล้วใส่แผนผังเว็บไซต์ไว้ที่เว็บไซต์นั้น และเพิ่ม rel=canonical หรือการเปลี่ยนเส้นทางไว้ในอีกเว็บไซต์หนึ่ง
- หากคุณมี URL ที่ต่างกันสำหรับหน้าเว็บรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป ขอแนะนำให้ชี้ไปที่เวอร์ชันเดียวเท่านั้นในแผนผังเว็บไซต์ แต่หากคิดว่าจำเป็นต้องชี้ไปที่ URL ทั้งคู่ ให้ใส่ข้อมูลเสริมใน URL เพื่อระบุว่าเป็นรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่
- ใช้ส่วนขยายแผนผังเว็บไซต์เพื่อชี้ไปที่สื่อประเภทอื่นๆ เช่น วิดีโอ รูปภาพ และข่าว
- หากมีหน้าเว็บทางเลือกสำหรับภาษาหรือภูมิภาคอื่น คุณจะใช้ hreflang ในแผนผังเว็บไซต์หรือแท็ก html เพื่อระบุ URL ทางเลือกได้
- อักขระที่ไม่ใช่ตัวอักษรผสมตัวเลขและตัวอักษรละติน เรากำหนดให้ไฟล์แผนผังเว็บไซต์ต้องเข้ารหัสแบบ UTF-8 (โดยทั่วไปคุณจะทำได้เมื่อบันทึกไฟล์) และเช่นเดียวกับไฟล์ XML ทั้งหมด ค่าของข้อมูลทุกค่า (รวมทั้ง URL) ต้องใช้อักขระหลีกสำหรับอักขระที่แสดงในตารางด้านล่างนี้ แผนผังเว็บไซต์มีได้เฉพาะอักขระ ASCII เท่านั้น ต้องไม่มีอักขระ ASCII ตัวพิมพ์ใหญ่ หรือรหัสควบคุมบางรหัส หรือสัญลักษณ์พิเศษ เช่น * และ {} หาก URL ของแผนผังเว็บไซต์มีอักขระเหล่านี้ คุณจะได้รับข้อผิดพลาดเมื่อพยายามเพิ่ม URL
อักขระ อักขระหลีก เครื่องหมาย & & & เครื่องหมายคำพูดเดี่ยว ' ' เครื่องหมายคำพูดคู่ " " เครื่องหมายมากกว่า > > เครื่องหมายน้อยกว่า < <
ต่อไปนี้คือตัวอย่าง URL ที่ใช้อักขระที่ไม่ใช่ ASCII (ü
) และอักขระที่ต้องใช้อักขระหลีก (&
):
http://www.example.com/ümlat.html&q=name
ต่อไปนี้เป็น URL เดียวกันซึ่งมีการเข้ารหัส ISO-8859-1 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL
http://www.example.com/%FCmlat.html&q=name
ต่อไปนี้เป็น URL เดียวกันซึ่งมีการเข้ารหัส UTF-8 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL
http://www.example.com/%C3%BCmlat.html&q=name
ต่อไปนี้เป็น URL เดียวกันซึ่งใช้อักขระหลีก
http://www.example.com/%C3%BCmlat.html&q=name
- โปรดทราบว่าแผนผังเว็บไซต์เป็นคำแนะนำให้ Google ทราบถึงหน้าเว็บที่คุณคิดว่าสำคัญ Google ไม่ได้รับประกันว่าจะรวบรวมข้อมูลทุก URL ในแผนผังเว็บไซต์
- Google ไม่สนใจค่า
<priority>
และ<changefreq>
จึงไม่จำเป็นต้องเพิ่มค่าเหล่านั้น - Google จะอ่านค่า
<lastmod>
แต่ถ้าคุณแสดงค่านี้ผิด เราจะหยุดอ่านค่านั้น - ตำแหน่งของ URL ในแผนผังเว็บไซต์ไม่สำคัญ เนื่องจาก Google จะไม่รวบรวมข้อมูล URL ตามลำดับที่ปรากฏในแผนผังเว็บไซต์
ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google (ส่งแผนผังเว็บไซต์ไปยัง Google)
Google ไม่ได้ตรวจสอบแผนผังเว็บไซต์ทุกครั้งที่มีการเข้ารวบรวมข้อมูล โดยจะตรวจสอบเฉพาะครั้งแรกที่เราเห็น และจะมีการตรวจสอบอีกหลังจากนั้นก็ต่อเมื่อคุณใช้คำสั่ง ping เพื่อแจ้งให้เราทราบว่ามีการเปลี่ยนแปลง คุณควรแจ้ง Google เกี่ยวกับแผนผังเว็บไซต์เฉพาะเมื่อเป็นแผนผังใหม่หรือเมื่อมีการอัปเดต อย่าส่งหรือใช้คำสั่ง ping แผนผังเว็บไซต์ที่ไม่มีการเปลี่ยนแปลงหลายครั้ง
การทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google มีหลายวิธีดังนี้
- ส่งไปยัง Google โดยใช้เครื่องมือแผนผังเว็บไซต์ของ Search Console
- ใส่บรรทัดต่อไปนี้ไว้ที่ใดก็ได้ในไฟล์
robots.txt
โดยระบุเส้นทางไปยังแผนผังเว็บไซต์
Sitemap: http://example.com/sitemap_location.xml
- ใช้ฟังก์ชัน "ping" เพื่อขอให้เรารวบรวมข้อมูลแผนผังเว็บไซต์ ส่งคำขอ HTTP GET ลักษณะนี้
http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
ตัวอย่างเช่น
http://www.google.com/ping?sitemap=https://example.com/sitemap.xml