การ Crawl ในเดือนธันวาคม: การไปยังส่วนต่างๆ ตามข้อมูลประกอบ

วันอังคารที่ 17 ธันวาคม 2024

เราเพิ่งเผยแพร่เอกสารใหม่เกี่ยวกับแนวทางปฏิบัติแนะนำสำหรับการไปยังส่วนต่างๆ ตามข้อมูลประกอบ ซึ่งต้นฉบับเผยแพร่เป็นบล็อกโพสต์ ต่อไปนี้เป็นสรุปข้อมูลบางส่วนที่สำคัญของหน้าเอกสารประกอบใหม่

การไปยังส่วนต่างๆ ตามข้อมูลประกอบเป็นวิธีที่ดีมากในการช่วยให้ผู้ใช้พบสิ่งที่ต้องการในเว็บไซต์ แต่อาจสร้างปัญหาใหญ่สำหรับ SEO หากใช้งานอย่างไม่ระมัดระวัง เป็นเพราะเหตุใด เนื่องจากวิธีนี้สามารถสร้าง URL ได้เกือบไม่จำกัด ซึ่งจะส่งผลให้เกิดปัญหาต่อไปนี้

  • การ Crawl มากเกินไป: เครื่องมือค้นหาเสียเวลาในการ Crawl URL จำนวนมากที่ไม่มีคุณค่าต่อผู้ใช้การค้นหา
  • การค้นพบช้าลง: การ Crawl มากเกินไปจะทำให้ระบบค้นพบเนื้อหาใหม่ที่สำคัญของคุณได้ช้าลง

ที่จริงแล้ว การไปยังส่วนต่างๆ ตามข้อมูลประกอบเป็นสาเหตุที่พบบ่อยที่สุดของปัญหาการ Crawl มากเกินไปที่เจ้าของเว็บไซต์รายงานให้เราทราบ และในกรณีส่วนใหญ่ ปัญหานี้สามารถหลีกเลี่ยงได้โดยทำตามแนวทางปฏิบัติแนะนำบางข้อ แต่เราขอย้อนกลับไปสักนิด

ปัญหาเกี่ยวกับ URL

โดยทั่วไปแล้ว ชุดค่าผสมของตัวกรองแต่ละชุดในการไปยังส่วนต่างๆ ตามข้อมูลประกอบจะสร้าง URL ที่ไม่ซ้ำกัน เช่น

https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny

การเปลี่ยนพารามิเตอร์ใดก็ตาม ไม่ว่าจะเป็น product, color หรือ size จะสร้าง URL ใหม่ ซึ่งอาจทําให้ URL เพิ่มขึ้นอย่างมาก และนี่ก็เป็นปัญหาที่เกิดขึ้น นั่นคือ URL ใหม่จำนวนมหาศาลที่รอให้ค้นพบ มาแก้ปัญหากัน

2 แนวทางในการแก้ปัญหา

  1. บล็อก URL การไปยังส่วนต่างๆ ตามข้อมูลประกอบ
    • หากไม่ต้องการให้จัดทำดัชนี URL เหล่านี้ ให้ใช้ robots.txt เพื่อไม่อนุญาตให้ทำการ Crawl
    • หรือใช้ส่วนย่อย URL (#) สำหรับตัวกรอง เนื่องจากโดยทั่วไปแล้วเครื่องมือค้นหาจะไม่สนใจ URL ส่วนย่อย
  2. เพิ่มประสิทธิภาพ URL การไปยังส่วนต่างๆ ตามข้อมูลประกอบ (หากต้องการให้ทำการ Crawl URL เหล่านี้โดยไม่คำนึงถึงต้นทุน)
    • ใช้ตัวคั่น & มาตรฐานสำหรับพารามิเตอร์ของ URL 💩 ไม่ใช่อักขระตัวคั่นพารามิเตอร์ที่ดี
    • รักษาลำดับของตัวกรองในเส้นทาง URL ให้สอดคล้องกัน
    • แสดงรหัสสถานะ 404 สำหรับชุดค่าผสมตัวกรองที่ไม่มีผลลัพธ์
    • หลีกเลี่ยงการเปลี่ยนเส้นทางผลการค้นหาที่ว่างเปล่าไปยังหน้า "ไม่พบ" ทั่วไป เว้นแต่คุณจะไม่มีตัวเลือกอื่น (เช่น คุณมีแอปหน้าเว็บเดียว)

สิ่งสำคัญที่ต้องคำนึงถึง

  • นอกจากนี้ คุณยังใช้ rel="canonical" เพื่อช่วยรวบรวมสัญญาณได้โดยชี้ตัวแปรไปยังหน้าหลัก การดำเนินการนี้จะใช้เวลาสักครู่
  • rel="nofollow" ในลิงก์ตัวกรองอาจทําให้มีการ Crawl น้อยลง แต่ต้องใช้อย่างสม่ำเสมอ กล่าวคือ ลิงก์ทุกลิงก์ที่ชี้ไปยังหน้าเหล่านี้ ทั้งภายในและภายนอก ต้องมีแอตทริบิวต์ rel="nofollow"
  • การ Crawl URL การไปยังส่วนต่างๆ ตามข้อมูลประกอบจะใช้ทรัพยากรเซิร์ฟเวอร์เสมอและอาจส่งผลต่อการค้นพบเนื้อหาใหม่

หากมีข้อเสนอแนะหรือต้องการคำชี้แจงเกี่ยวกับเอกสารใหม่เกี่ยวกับแนวทางปฏิบัติแนะนำสำหรับการไปยังส่วนต่างๆ ตามข้อมูลประกอบนี้ ให้ใช้เครื่องมือแสดงความคิดเห็นในเอกสารดังกล่าว หากคุณสนใจเรื่องการไปยังส่วนต่างๆ ตามข้อมูลประกอบจริงๆ และอยากพูดคุยในเรื่องนี้กับผู้อื่น โปรดไปที่ชุมชน Search Central หรือจะไปหาเราใน LinkedIn ก็ได้


หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับการ Crawl ดูซีรีส์เรื่องการ Crawl ในเดือนธันวาคมทั้งหมดได้ที่