Googlebot จะรวบรวมข้อมูลผ่าน HTTP/2 เร็วๆ นี้

วันพฤหัสบดีที่ 17 กันยายน 2020

ตั้งแต่เดือนพฤศจิกายน 2020 เป็นต้นไป Googlebot จะเริ่มรวบรวมข้อมูลบางเว็บไซต์ผ่าน HTTP/2

ตั้งแต่เบราว์เซอร์ยอดนิยมเริ่มรองรับเวอร์ชันหลักรุ่นถัดไปของ HTTP อย่าง HTTP/2 หรือที่เรียกสั้นๆ ว่า h2 ผู้คนในวงการเว็บก็เริ่มถามเราว่า Googlebot สามารถรวบรวมข้อมูลผ่านโปรโตคอลเวอร์ชันอัปเกรดที่มีความทันสมัยมากขึ้นได้หรือไม่

วันนี้เราขอประกาศให้ทราบว่าตั้งแต่ช่วงกลางเดือนพฤศจิกายน 2020 เป็นต้นไป Googlebot จะรองรับการรวบรวมข้อมูลผ่าน HTTP/2 สำหรับบางเว็บไซต์

HTTP/2 คืออะไร

อย่างที่เกริ่นไปแล้ว HTTP/2 คือเวอร์ชันหลักรุ่นถัดไปของ HTTP หรือโปรโตคอลที่อินเทอร์เน็ตใช้โอนข้อมูลเป็นหลักนั่นเอง สถาปัตยกรรมของ HTTP/2 ตลอดจนฟีเจอร์ที่ใช้สำหรับไคลเอ็นต์ (เช่น เบราว์เซอร์ของคุณ) และเซิร์ฟเวอร์ต่างๆ ทำให้โปรโตคอลเวอร์ชันนี้มีประสิทธิภาพและรวดเร็วกว่ารุ่นก่อนหน้ามาก หากต้องการอ่านเพิ่มเติม เรามีบทความแบบยาวเรื่อง HTTP/2

ทำไมเราจึงทำการเปลี่ยนแปลงนี้

โดยทั่วไปแล้วเราคาดหวังว่าการเปลี่ยนแปลงนี้จะทำให้รวบรวมข้อมูลได้อย่างมีประสิทธิภาพมากขึ้นในแง่ของการใช้งานทรัพยากรเซิร์ฟเวอร์ Googlebot สามารถเปิดการเชื่อมต่อ TCP รายการเดียวไปยังเซิร์ฟเวอร์เมื่อใช้ h2 และโอนหลายๆ ไฟล์พร้อมกันผ่านโปรโตคอลนี้ได้อย่างมีประสิทธิภาพ แทนที่จะต้องใช้การเชื่อมต่อหลายรายการ ยิ่งเปิดการเชื่อมต่อน้อยลง ก็ยิ่งทำให้เซิร์ฟเวอร์และ Googlebot ใช้ทรัพยากรในการรวบรวมข้อมูลน้อยลงด้วย

วิธีการทำงาน

ในระยะแรก เราจะรวบรวมข้อมูลเว็บไซต์จำนวนหนึ่งผ่าน h2 และจะค่อยๆ เพิ่มจำนวนเว็บไซต์ที่อาจได้รับประโยชน์จากฟีเจอร์ที่รองรับตั้งแต่ต้นอย่างเช่นการขอทำ Multiplex

Googlebot เลือกเว็บไซต์ที่จะรวบรวมข้อมูลผ่าน h2 โดยดูว่าเว็บไซต์รองรับ h2 หรือไม่ และทั้งเว็บไซต์และ Googlebot จะได้รับประโยชน์จากการรวบรวมข้อมูลผ่าน HTTP/2 หรือไม่ หากเซิร์ฟเวอร์ของคุณรองรับ h2 และ Googlebot รวบรวมข้อมูลจากเว็บไซต์ของคุณมาเยอะแล้ว คุณอาจมีสิทธิ์อัปเกรดการเชื่อมต่อโดยที่ไม่ต้องดำเนินการใดๆ

หากเซิร์ฟเวอร์ของคุณยังสื่อสารผ่าน HTTP/1.1 อย่างเดียวก็ไม่เป็นไร การรวบรวมข้อมูลผ่านโปรโตคอลนี้ไม่มีข้อด้อยที่ชัดแจ้ง โดยจะยังคงคุณภาพและปริมาณในระดับเดิม

วิธีการเลือกไม่ใช้

จากการทดสอบเบื้องต้น เราไม่พบปัญหาหรือผลกระทบในแง่ลบต่อการจัดทำดัชนี แต่เราทราบดีว่าคุณอาจต้องการเลือกไม่ใช้การรวบรวมข้อมูลผ่าน HTTP/2 ด้วยเหตุผลต่างๆ ซึ่งคุณเลือกไม่ใช้ได้โดยสั่งให้เซิร์ฟเวอร์ตอบสนองด้วยรหัสสถานะ HTTP 421 เมื่อ Googlebot พยายามรวบรวมข้อมูลเว็บไซต์ของคุณผ่าน h2 หากยังดำเนินการไม่ได้ในตอนนี้ ให้ส่งข้อความถึงทีม Googlebot (แต่นี่เป็นวิธีแก้ปัญหาชั่วคราวเท่านั้น)

หากมีข้อสงสัยเพิ่มเติมเกี่ยวกับ Googlebot และ HTTP/2 โปรดดูคำถามที่เราคาดว่าคุณอาจถาม หากไม่พบคำถามที่ต้องการ โปรดเขียนมาหาเราทาง Twitter และในฟอรัมความช่วยเหลือ

คำถามที่เราคาดว่าคุณอาจถาม

ทำไมคุณจึงอัปเกรด Googlebot ในตอนนี้

ซอฟต์แวร์ที่เราใช้เพื่อทำให้ Googlebot รวบรวมข้อมูลผ่าน h2 มีความเสถียรมากพอที่จะนำมาใช้งานจริง

ฉันต้องอัปเกรดเซิร์ฟเวอร์ของฉันทันทีเลยไหม

จริงๆ แล้วขึ้นอยู่กับคุณเลย แต่เราจะเปลี่ยนไปรวบรวมข้อมูลผ่าน h2 สำหรับเว็บไซต์ที่รองรับและจะได้รับประโยชน์จากโปรโตคอลนี้อย่างชัดเจนเท่านั้น Googlebot จะรวบรวมข้อมูลผ่าน h1 ต่อไปหากไม่พบประโยชน์ที่ชัดเจนของการรวบรวมข้อมูลผ่าน h2

ฉันจะทดสอบได้อย่างไรว่าเว็บไซต์รองรับ h2 หรือไม่

Cloudflare มีบล็อกโพสต์เกี่ยวกับวิธีการต่างๆ มากมายในการทดสอบว่าเว็บไซต์รองรับ h2 หรือไม่ ลองไปศึกษาดูได้

ฉันจะอัปเกรดเว็บไซต์เป็น h2 ได้อย่างไร

เรื่องนี้จะขึ้นอยู่กับเซิร์ฟเวอร์ของคุณ เราขอแนะนำให้สอบถามผู้ดูแลระบบเซิร์ฟเวอร์หรือผู้ให้บริการโฮสติ้ง

ฉันจะทำให้ Googlebot รวบรวมข้อมูลเว็บไซต์ผ่าน h2 ได้อย่างไร

คุณทำไม่ได้ หากเว็บไซต์รองรับ h2 ก็จะมีสิทธิ์ได้รับการรวบรวมข้อมูลผ่าน h2 แต่เฉพาะในกรณีเว็บไซต์และ Googlebot จะได้รับประโยชน์จากการรวบรวมข้อมูลผ่านโปรโตคอลดังกล่าวเท่านั้น ตัวอย่างเช่น หากการรวบรวมข้อมูลผ่าน h2 ไม่ช่วยให้ใช้ทรัพยากรน้อยลงอย่างเห็นได้ชัด เราก็จะรวบรวมข้อมูลเว็บไซต์ผ่าน HTTP/1.1 ต่อไป

ทำไมคุณจึงไม่รวบรวมข้อมูลเว็บไซต์ที่เปิดใช้ h2 ทั้งหมดผ่าน h2

จากที่ประเมินดูแล้ว เราพบว่าเว็บไซต์บางแห่งได้รับประโยชน์เพียงเล็กน้อยหรือไม่ได้รับประโยชน์เลย (เช่น เว็บไซต์ที่มี QPS ต่ำมาก) เมื่อรวบรวมข้อมูลผ่าน h2 เราจึงตัดสินใจที่จะเปลี่ยนไปรวบรวมข้อมูลผ่าน h2 เมื่อเว็บไซต์ได้รับประโยชน์อย่างชัดเจนเท่านั้น เราจะประเมินประสิทธิภาพที่ได้รับกันต่อไปและอาจเปลี่ยนแปลงเกณฑ์การรวบรวมข้อมูลผ่าน h2 ในอนาคต

ฉันจะทราบได้อย่างไรว่าเว็บไซต์ได้รับการรวบรวมข้อมูลผ่าน h2

เมื่อเว็บไซต์มีสิทธิ์สำหรับการรวบรวมข้อมูลผ่าน h2 เจ้าของเว็บไซต์ดังกล่าวที่ลงทะเบียนใน Search Console จะได้รับข้อความแจ้งว่าจากนี้ไปอาจมีการเข้ารวบรวมข้อมูลบางส่วนผ่าน h2 คุณยังตรวจสอบในบันทึกเซิร์ฟเวอร์ได้ด้วย (เช่น ในไฟล์ access.log หากคุณเรียกใช้เว็บไซต์บน Apache)

Googlebot รองรับฟีเจอร์ใดของ h2 บ้าง

Googlebot รองรับฟีเจอร์ส่วนใหญ่ที่ h2 มี ส่วนฟีเจอร์บางอย่าง เช่น พุชจากเซิร์ฟเวอร์ ซึ่งอาจมีประโยชน์ต่อการแสดงภาพ ยังอยู่ระหว่างการประเมิน

Googlebot รองรับ HTTP/2 แบบข้อความธรรมดา (h2c) ไหม

ไม่ เว็บไซต์ต้องใช้ HTTPS และรองรับ HTTP/2 จึงจะมีสิทธิ์สำหรับการรวบรวมข้อมูลผ่าน HTTP/2 ซึ่งเทียบเท่ากับวิธีที่เบราว์เซอร์ที่ทันสมัยทำ

Googlebot จะใช้ส่วนขยาย ALPN เพื่อเลือกเวอร์ชันโปรโตคอลที่จะใช้รวบรวมข้อมูลไหม

การเจรจาต่อรองโปรโตคอลในเลเยอร์แอปพลิเคชัน (ALPN) จะใช้สำหรับเว็บไซต์ที่เลือกใช้การรวบรวมข้อมูลผ่าน h2 เท่านั้น และโปรโตคอลเดียวที่ยอมรับสำหรับการตอบสนองจะต้องเป็น h2 หากเซิร์ฟเวอร์ตอบสนองระหว่างการแฮนด์เชค TLS ด้วยโปรโตคอลเวอร์ชันอื่นที่ไม่ใช่ h2 จะทำให้ Googlebot ไม่รวบรวมข้อมูลแล้วค่อยกลับมาใหม่ผ่านทาง HTTP/1.1

ฟีเจอร์ต่างๆ ของ h2 จะช่วยรวบรวมข้อมูลอย่างไร

ประโยชน์ที่โดดเด่นที่สุดส่วนหนึ่งของ h2 ได้แก่

  • การทำ Multiplex และการเกิดขึ้นพร้อมกัน: การเปิดการเชื่อมต่อ TCP น้อยลงจะทำให้มีการใช้ทรัพยากรน้อยลงด้วย
  • การบีบอัดส่วนหัว: ขนาดส่วนหัว HTTP ที่ลดลงอย่างมากจะช่วยประหยัดทรัพยากร
  • พุชจากเซิร์ฟเวอร์: เรายังไม่เปิดใช้ฟีเจอร์นี้ เนื่องจากยังอยู่ในระยะของการประเมิน ฟีเจอร์นี้อาจเป็นประโยชน์สำหรับการแสดงภาพ แต่เรายังไม่มีความเห็นที่เจาะจงเกี่ยวกับฟีเจอร์นี้ในขณะนี้

หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับฟีเจอร์เฉพาะของ h2 และความเกี่ยวข้องกับการรวบรวมข้อมูล โปรดส่งคำถามมาทาง Twitter

Googlebot จะรวบรวมข้อมูลผ่าน h2 ได้มากขึ้นหรือเร็วขึ้นไหม

ประโยชน์หลักของ h2 คือการประหยัดทรัพยากร ทั้งฝั่งเซิร์ฟเวอร์และฝั่ง Googlebot ไม่ว่าเราจะรวบรวมข้อมูลผ่าน h1 หรือ h2 ก็ไม่ส่งผลต่อวิธีการจัดทำดัชนีเว็บไซต์ ดังนั้นจึงไม่ส่งผลต่อปริมาณข้อมูลที่เราวางแผนว่าจะรวบรวมจากเว็บไซต์ของคุณ

การรวบรวมข้อมูลผ่าน h2 มีข้อดีต่อการจัดอันดับของเว็บไซต์ไหม

ไม่มี