Google ทำการ Crawl หน้าที่ปรับตามสถานที่/ภาษาอย่างไร
หากเว็บไซต์มีหน้าที่ปรับตามสถานที่/ภาษา (กล่าวคือเว็บไซต์จะแสดงผลเนื้อหาต่างกันตามประเทศที่ดูหรือภาษาที่ต้องการของผู้เข้าชม) Google อาจไม่ทำการ Crawl, จัดทำดัชนี หรือจัดอันดับเนื้อหาทั้งหมดในภาษาต่างๆ เนื่องจากที่อยู่ IP เริ่มต้นของ Crawler Googlebot ดูเหมือนว่าอยู่ในสหรัฐอเมริกา และ Crawler จะส่งคำขอ HTTP โดยไม่มีการตั้งค่า Accept-Language
ในส่วนหัวของคำขอด้วย
การ Crawl แบบกระจายตามตำแหน่งทางภูมิศาสตร์
Googlebot รวบรวมข้อมูลด้วยที่อยู่ IP นอกประเทศสหรัฐอเมริกา นอกเหนือจากที่อยู่ IP ในสหรัฐอเมริกา
อย่างที่เราได้แนะนำอยู่เสมอว่าเมื่อ Googlebot มาจากประเทศหนึ่งๆ ให้คุณดำเนินการกับ Googlebot เช่นเดียวกับที่จะดำเนินการกับผู้ใช้คนอื่นจากประเทศนั้น ซึ่งหมายความว่าหากคุณบล็อกไม่ให้ผู้ใช้ในสหรัฐอเมริกาเข้าถึงเนื้อหาของคุณ แต่อนุญาตให้ผู้เข้าชมจากออสเตรเลียเข้าชมเนื้อหาได้ เซิร์ฟเวอร์ก็ควรจะบล็อก Googlebot หากดูเหมือนว่ามาจากสหรัฐอเมริกา แต่อนุญาตให้ Googlebot ที่ดูเหมือนว่ามาจากออสเตรเลียเข้าถึงเนื้อหาได้
ข้อควรพิจารณาอื่นๆ
- Googlebot ใช้สตริง User Agent เดียวกันสำหรับการกำหนดค่าการรวบรวมข้อมูลทั้งหมด ดูข้อมูลเพิ่มเติมเกี่ยวกับสตริง User Agent ที่ Crawler ของ Google ใช้
- คุณยืนยันการ Crawl แบบกระจายตามตำแหน่งทางภูมิศาสตร์ของ Googlebot ได้โดยใช้การค้นหา DNS แบบย้อนกลับ
- หากเว็บไซต์ใช้โปรโตคอลการยกเว้นสำหรับโรบ็อต ให้ตรวจสอบว่าคุณใช้โปรโตคอลดังกล่าวอย่างสอดคล้องกันในทุกภาษา ซึ่งหมายความว่าแท็ก
meta
ของโรบ็อตและไฟล์ robots.txt ต้องระบุกฎเดียวกันในทุกสถานที่/ภาษา