วันจันทร์ที่ 26 มิถุนายน 2023
โปรโตคอล Sitemap เริ่มต้นการใช้งานในปี 2005 เพื่อช่วยให้เครื่องมือค้นหาค้นพบ URL ใหม่ๆ และเพื่อช่วยในการตั้งเวลาทำการ Crawl URL ที่ค้นพบแล้วใหม่อีกครั้ง ซึ่งเป็นโปรโตคอลที่ได้รับความนิยมอย่างกว้างขวางและไม่มีการเปลี่ยนแปลงมากว่า 15 ปี แม้โดยทั่วไปแนวคิดนี้จะยังมีประโยชน์อยู่ แต่ก็มีบางแง่มุมที่นํามาใช้ได้น้อยลงในอินเทอร์เน็ตทุกวันนี้
ด้วยเหตุนี้ เราจึงขอประกาศเลิกใช้งานปลายทาง "ping" ของ Sitemap และให้คําแนะนําเพิ่มเติมในการใช้องค์ประกอบ lastmod
คําสั่ง ping ของ Sitemap
โปรโตคอล Sitemap กําหนดเมธอด REST ที่ไม่ได้ตรวจสอบสิทธิ์สําหรับส่ง Sitemap ไปยังเครื่องมือค้นหา จากการศึกษาภายในของเราและเครื่องมือค้นหาอื่นๆ เช่น Bing ยังบอกด้วยว่า ณ จุดนี้ Sitemap ที่ไม่ผ่านการตรวจสอบสิทธิ์เหล่านี้อาจไม่มีประโยชน์มากนัก ที่จริงแล้ว ในกรณีของ Google Search ข้อมูลส่วนใหญ่ที่ส่งไปจะเป็นจดหมายขยะ กล่าวโดยเจาะจงก็คือ เราจะไม่รองรับการใช้คําสั่ง ping ของ Sitemap และปลายทางจะหยุดทํางานในอีก 6 เดือน คุณยังคงส่ง Sitemap ผ่าน robots.txt และ Search Console ได้ แต่คําขอ HTTP ("ping") ไปยังปลายทาง REST ที่เลิกใช้งานแล้วจะส่งผลให้มีข้อผิดพลาด 404
โค้ดหรือปลั๊กอินที่มีอยู่ที่ใช้ปลายทางนี้จะไม่ทําให้เกิดปัญหาของ Google Search คุณไม่ต้องทําการเปลี่ยนแปลงใดๆ (แต่การใช้ปลายทางจะไม่มีประโยชน์ใดๆ เช่นกัน)
องค์ประกอบ lastmod
ตลอดหลายปีที่ผ่านมา เราได้สังเกตเห็นว่าองค์ประกอบ lastmod
มีประโยชน์ในหลายระดับแตกต่างกันออกไปในเว็บไซต์ที่ให้องค์ประกอบนี้ ซึ่งอาจเป็นผลมาจากประเภทเนื้อหาที่เผยแพร่หรืออาจเป็นเพราะระบบจัดการเนื้อหา แต่ปัจจุบัน lastmod
มีประโยชน์อย่างมากในหลายกรณี และเราใช้เป็นสัญญาณในการกําหนดเวลาทำการ Crawl กับ URL ที่เราค้นพบไปแล้วก่อนหน้านี้
เพื่อให้องค์ประกอบ lastmod
เป็นประโยชน์ ประการแรกคุณต้องใส่รูปแบบวันที่ที่รองรับ (ดูข้อมูลได้ใน sitemaps.org) โดย Search Console จะบอกคุณเองหากระบบไม่รองรับรูปแบบที่คุณใช้เมื่อส่ง Sitemap ประการที่ 2 ข้อมูลต้องเป็นความจริงและสม่ำเสมอ กล่าวคือหากหน้าเว็บมีการเปลี่ยนแปลงเมื่อ 7 ปีที่แล้ว แต่คุณระบุในองค์ประกอบ lastmod
ว่าการเปลี่ยนแปลงเกิดขึ้นเมื่อวานนี้ สุดท้ายแล้วเราก็จะไม่เชื่อคุณอีกในเรื่องของวันที่แก้ไขหน้าครั้้งล่าสุด
คุณใช้องค์ประกอบ lastmod
กับทุกหน้าใน Sitemap หรือเฉพาะหน้าที่คุณมั่นใจได้ ตัวอย่างเช่น ซอฟต์แวร์เว็บไซต์บางแห่งอาจบอกวันที่แก้ไขล่าสุดของหน้าแรกหรือหน้าหมวดหมู่ได้ง่าย เนื่องจากมีการรวมหน้าอื่นๆ ในเว็บไซต์ไว้เฉยๆ ในกรณีเช่นนี้ คุณก็ไม่ควรวาง lastmod
ในหน้าเหล่านั้น
และเมื่อเราพูดว่า "แก้ไขล่าสุด" เราหมายถึง "การแก้ไขที่สำคัญครั้งล่าสุด" หาก CMS เปลี่ยนข้อความที่ไม่มีนัยสําคัญในแถบด้านข้างหรือส่วนท้าย คุณไม่จําเป็นต้องอัปเดตค่า lastmod
สําหรับหน้านั้น
อย่างไรก็ตาม หากคุณเปลี่ยนข้อความหลัก เพิ่มหรือเปลี่ยนแปลง Structured Data หรืออัปเดตบางลิงก์ ก็อัปเดตค่า lastmod
ได้
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <lastmod>2005-01-01</lastmod> <loc>http://www.example.com/</loc> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
ขอออกนอกเรื่องนิดหน่อย หากดูแอตทริบิวต์ xmlns
ในข้อมูลโค้ด Sitemap คุณจะเห็นว่า URI อยู่ใน HTTP และไม่อยู่ใน HTTPS ซึ่งเป็นการทํางานอย่างที่ตั้งใจไว้ โดยเป็นการอ้างอิงสําหรับโปรแกรมแยกวิเคราะห์เกี่ยวกับองค์ประกอบใน XML โปรดอย่าส่งความคิดเห็นเพิ่มเติมเกี่ยวกับเรื่องนี้
changefreq
และ priority
Google ยังคงไม่ได้ใช้องค์ประกอบ changefreq
หรือ priority
เลย
โดยเฉพาะ changefreq
ก็ยังคงเป็นแนวคิดที่ซ้อนทับกับ lastmod
อยู่ด้วย
องค์ประกอบ priority
เป็นฟิลด์ที่แล้วแต่ใครจะคิดเห็นอย่างไรเป็นอย่างมาก และเมื่ออิงตามการศึกษาภายในของเรา โดยทั่วไปแล้วองค์ประกอบนี้ไม่ได้แสดงถึงลําดับความสําคัญที่แท้จริงของหน้าหนึ่งๆ เมื่อเทียบกับหน้าอื่นๆ ในเว็บไซต์
หากต้องการอ่านเพิ่มเติมเกี่ยวกับ Sitemap โปรดดูเอกสารประกอบของเราหรือที่ sitemaps.org ก็ได้ และหากอยากคุยกับเราเกี่ยวกับ Sitemap คุณพบเราได้ที่ฟอรัม Google Search Central และทาง Twitter