เปิดตัวรุ่นใหม่ของฟีเจอร์ข้อผิดพลาดที่พบเมื่อเข้ารวบรวมข้อมูล

วันจันทร์ที่ 12 มีนาคม 2012

ข้อผิดพลาดที่พบเมื่อเข้ารวบรวมข้อมูลเป็นหนึ่งในฟีเจอร์ที่ได้รับความนิยมมากที่สุดในเครื่องมือของผู้ดูแลเว็บ และในวันนี้เราจะเปิดตัวการเพิ่มประสิทธิภาพที่สำคัญอย่างยิ่งบางประการซึ่งจะเอื้อประโยชน์มากขึ้นอีก

ตอนนี้เราตรวจพบและรายงานข้อผิดพลาดประเภทใหม่ๆ อีกหลายประเภท และได้แบ่งข้อผิดพลาดออกเป็น 2 ส่วน ได้แก่ ข้อผิดพลาดของเว็บไซต์และข้อผิดพลาดเกี่ยวกับ URL เพื่อช่วยในการทำความเข้าใจข้อมูลใหม่ดังกล่าว

ข้อผิดพลาดของเว็บไซต์

ข้อผิดพลาดของเว็บไซต์คือข้อผิดพลาดที่ไม่ได้เจาะจง URL ใดโดยเฉพาะ แต่เป็นข้อผิดพลาดที่ส่งผลต่อทั้งเว็บไซต์ ข้อผิดพลาดเหล่านี้รวมถึงการแปลง DNS ที่ไม่สำเร็จ ปัญหาการเชื่อมต่อกับเว็บเซิร์ฟเวอร์ของคุณ และปัญหาในการดึงข้อมูลไฟล์ robots.txt เราเคยรายงานข้อผิดพลาดเหล่านี้ตาม URL แต่ก็ไม่สมเหตุสมผลนักเพราะข้อผิดพลาดไม่ได้เกิดกับ URL ใดโดยเฉพาะ ซึ่งที่จริงปัญหานี้ทำให้ Googlebot ทำงานต่างๆ ไม่ได้แม้แต่การขอ URL ด้วยซ้ำไป ตอนนี้เราจึงติดตามอัตราการทำงานไม่สำเร็จสำหรับข้อผิดพลาดทั้งเว็บไซต์แต่ละประเภทแทน และจะพยายามส่งการแจ้งเตือนให้คุณด้วยเมื่อข้อผิดพลาดเหล่านี้เกิดขึ้นบ่อยพอที่จะต้องให้ความสนใจ

มุมมองอัตราและจำนวนข้อผิดพลาดของเว็บไซต์ตลอดช่วงเวลาที่ผ่านมาในเครื่องมือของผู้ดูแลเว็บ

นอกจากนี้ หากคุณไม่มี (และที่ผ่านมาก็ไม่มี) ปัญหาใดเลยในด้านต่างๆ เหล่านี้ ซึ่งก็เหมือนกับเว็บไซต์อื่นๆ จำนวนมาก เราจะไม่แสดงส่วนนี้ให้คุณเห็น แต่จะแสดงเพียงเครื่องหมายถูกที่ให้ความรู้สึกสบายใจแทน เพื่อให้คุณทราบว่าทุกอย่างเรียบร้อยดี

มุมมองข้อผิดพลาดของเว็บไซต์ในเครื่องมือของผู้ดูแลเว็บที่ไม่แสดงข้อผิดพลาด

ข้อผิดพลาดเกี่ยวกับ URL

ข้อผิดพลาดเกี่ยวกับ URL คือข้อผิดพลาดที่เกิดขึ้นเฉพาะกับหน้าหนึ่งๆ ซึ่งหมายความว่าเมื่อ Googlebot พยายามรวบรวมข้อมูล URL ระบบสามารถแปลง DNS, เชื่อมต่อกับเซิร์ฟเวอร์ของคุณ, ดึงข้อมูลและอ่านไฟล์ robots.txt แล้วขอ URL นี้ได้ แต่กลับมีบางอย่างผิดพลาดหลังจากนั้น เราแบ่งข้อผิดพลาดเกี่ยวกับ URL ออกเป็นหมวดหมู่ต่างๆ ตามสาเหตุที่ทำให้เกิดข้อผิดพลาดดังกล่าว หากเว็บไซต์จัดเตรียมข้อมูลเพื่อแสดงใน Google News หรืออุปกรณ์เคลื่อนที่ (CHTML/XHTML) เราจะแสดงหมวดหมู่สำหรับข้อผิดพลาดเหล่านั้นแยกต่างหาก

มุมมองข้อผิดพลาดเกี่ยวกับ URL ในเครื่องมือของผู้ดูแลเว็บซึ่งจัดหมวดหมู่ตามประเภทที่มีจำนวนทั้งหมดทั้งในปัจจุบันและในอดีต

ใช้หลักการน้อยแต่มาก

เราเคยแสดงข้อผิดพลาดประเภทละไม่เกิน 100,000 รายการ การพยายามใช้ประโยชน์จากข้อมูลนี้ทั้งหมดก็เหมือนกับการดื่มน้ำจากท่อดับเพลิง และคุณไม่มีทางรู้เลยว่ามีข้อผิดพลาดใดบ้างที่สำคัญ (เช่น หน้าแรกล่ม) หรือไม่สำคัญนัก (เช่น เว็บไซต์ส่วนตัวของใครบางคนพิมพ์ลิงก์ที่ชี้ไปยังเว็บไซต์ของคุณผิด) ในทางปฏิบัติคุณไม่สามารถดูข้อผิดพลาดทั้ง 100,000 รายการนั้นได้ และไม่มีวิธีที่จะจัดเรียง ค้นหา หรือทำเครื่องหมายความคืบหน้ารายการเหล่านั้น ในเวอร์ชันใหม่ของฟีเจอร์นี้ เราจะเน้นแสดงเฉพาะข้อผิดพลาดที่สำคัญที่สุดให้คุณเห็นก่อน โดยสําหรับแต่ละหมวดหมู่ เราจะอธิบายสิ่งที่คิดว่าเป็นข้อผิดพลาดที่สำคัญที่สุดและดำเนินการได้จำนวน 1,000 รายการ คุณจัดเรียงและกรองข้อผิดพลาด 1,000 อันดับแรกเหล่านี้ได้ โปรดแจ้งให้เราทราบเมื่อคิดว่าได้แก้ไขข้อผิดพลาดเหล่านั้นแล้ว รวมทั้งดูรายละเอียดเกี่ยวกับข้อผิดพลาดดังกล่าว

ฟังก์ชันการจัดเรียงในมุมมองข้อผิดพลาดจากการ Crawl ของเครื่องมือของผู้ดูแลเว็บ

บางเว็บไซต์มีข้อผิดพลาดประเภทหนึ่งๆ มากกว่า 1,000 รายการ คุณจึงยังคงเห็นจำนวนข้อผิดพลาดทั้งหมดที่มีในแต่ละประเภท รวมถึงกราฟที่แสดงข้อมูลย้อนหลัง 90 วัน สำหรับผู้ที่กังวลว่ารายละเอียดข้อผิดพลาด 1,000 รายการและจำนวนรวมทั้งหมดจะไม่เพียงพอ เรากำลังพิจารณาเพิ่มการเข้าถึงแบบเป็นโปรแกรม (API) เพื่อช่วยให้คุณดาวน์โหลดข้อผิดพลาดล่าสุดทุกๆ รายการได้ ดังนั้นโปรดแจ้งให้เราทราบหากต้องการข้อมูลมากกว่านั้น

นอกจากนี้เรายังได้นำรายการหน้าเว็บที่ robots.txt บล็อกไว้ออก เนื่องจากแม้ว่าบางครั้งหน้าเหล่านี้อาจเป็นประโยชน์ต่อการวินิจฉัยปัญหาของไฟล์ robots.txt แต่ก็มักจะเป็นหน้าที่คุณตั้งใจบล็อกไว้อยู่แล้ว เราต้องการมุ่งเน้นที่ข้อผิดพลาด ดังนั้นโปรดมองหาข้อมูลเกี่ยวกับ URL ที่มีการป้องกันด้วยไฟล์ Robots ซึ่งจะแสดงให้เห็นเร็วๆ นี้ในฟีเจอร์ "การเข้าถึงของโปรแกรมรวบรวมข้อมูล" ในส่วน "การกำหนดค่าเว็บไซต์"

เจาะลึกลงไปในรายละเอียด

การคลิกที่ URL ของข้อผิดพลาดแต่ละรายการจากรายการหลักจะแสดงแผงรายละเอียดพร้อมข้อมูลเพิ่มเติม ซึ่งรวมถึงเวลาที่เราพยายามรวบรวมข้อมูล URL นั้นๆ ครั้งล่าสุด เวลาที่เราพบปัญหาเป็นครั้งแรก และคำอธิบายข้อผิดพลาดโดยสรุป

มุมมองรายละเอียดของข้อผิดพลาดระดับ URL

จากแผงรายละเอียด คุณสามารถคลิกลิงก์ของ URL ที่ทำให้เกิดข้อผิดพลาดเพื่อดูให้เห็นกับตาว่าเกิดอะไรขึ้นเมื่อคุณพยายามไปยัง URL ดังกล่าว นอกจากนี้คุณยังสามารถทำเครื่องหมายข้อผิดพลาดเป็น "แก้ไขแล้ว" (จะมีข้อมูลเพิ่มเติมให้ในภายหลัง) ดูเนื้อหาช่วยเหลือสำหรับข้อผิดพลาดประเภทนั้นๆ แสดงรายการแผนผังเว็บไซต์ที่มี URL นี้ ดูหน้าอื่นๆ ที่ลิงก์ไปยัง URL นี้ และแม้กระทั่งให้ Googlebot ดึงข้อมูล URL ในขณะนั้นเลย ไม่ว่าจะเพื่อดูข้อมูลเพิ่มเติมหรือตรวจสอบอีกครั้งว่าการแก้ไขของคุณแก้ปัญหาได้จริง

แผงในมุมมองข้อผิดพลาดจากการ Crawl ในเครื่องมือผู้ดูแลเว็บที่แสดงหน้าซึ่งลิงก์กับหน้าที่มีข้อผิดพลาด

ลงมือดำเนินการ

มีอยู่อย่างหนึ่งที่เรารู้สึกตื่นเต้นมากในฟีเจอร์ข้อผิดพลาดที่พบเมื่อเข้ารวบรวมข้อมูลเวอร์ชันใหม่นี้ นั่นคือคุณจะมุ่งเน้นที่การแก้ไขสิ่งที่สำคัญที่สุดก่อนได้อย่างแท้จริง เราได้จัดอันดับรายการข้อผิดพลาดที่เรียงลําดับตามความสำคัญให้ด้านบนเป็นข้อผิดพลาดที่มีบางอย่างที่คุณจะแก้ไขได้ เช่น การแก้ไขลิงก์เสียในเว็บไซต์ของคุณเอง การแก้ไขข้อบกพร่องในซอฟต์แวร์ของเซิร์ฟเวอร์ การอัปเดตแผนผังเว็บไซต์เพื่อตัด URL ที่ไม่ใช้งานแล้วออก หรือการเพิ่มการเปลี่ยนเส้นทาง 301 เพื่อนำผู้ใช้ไปยังหน้าที่ "ใช้จริง" เรากำหนดข้อผิดพลาดที่จะแสดงด้านบนดังกล่าวโดยพิจารณาจากปัจจัยต่างๆ มากมาย เช่น คุณได้ใส่ URL นั้นในแผนผังเว็บไซต์ไหม มีการลิงก์มายัง URL นี้จากที่ต่างๆ กี่แห่ง (และมีลิงก์ใดอยู่ในเว็บไซต์ของคุณเองหรือไม่) และ URL นั้นได้รับการเข้าชมจากการค้นหาเมื่อเร็วๆ นี้หรือไม่

เมื่อคิดว่าแก้ไขปัญหาได้แล้ว (สามารถทดสอบการแก้ไขด้วยการดึงข้อมูล URL เหมือนกับเป็น Googlebot) โปรดแจ้งให้เราทราบโดยทำเครื่องหมายข้อผิดพลาดเป็น "แก้ไขแล้ว" หากคุณเป็นผู้ใช้ ที่มีสิทธิ์เข้าถึงเต็มรูปแบบ การดำเนินการนี้จะนำข้อผิดพลาดนั้นออกจากรายการ ในอนาคต ข้อผิดพลาดที่คุณทำเครื่องหมายว่าแก้ไขแล้วจะไม่รวมอยู่ในรายการข้อผิดพลาดที่สำคัญ เว้นแต่เราจะพบข้อผิดพลาดเดียวกันนั้นเมื่อพยายามรวบรวมข้อมูล URL อีกครั้ง

แผงที่อนุญาตให้ผู้ใช้ทําเครื่องหมายข้อผิดพลาดที่แก้ไขแล้วในเครื่องมือของผู้ดูแลเว็บ

เราทำงานอย่างหนักในการพัฒนาฟีเจอร์ข้อผิดพลาดที่พบเมื่อเข้ารวบรวมข้อมูลใหม่นี้ จึงหวังว่าจะมีประโยชน์กับคุณอย่างมาก อย่าลืมบอกให้เราทราบว่าคุณคิดเห็นอย่างไร และไปที่ฟอรัมหากมีคำแนะนำ