วันพฤหัสบดีที่ 17 กันยายน 2020
ตั้งแต่เดือนพฤศจิกายน 2020 เป็นต้นไป Googlebot จะเริ่มรวบรวมข้อมูลบางเว็บไซต์ผ่าน HTTP/2
ตั้งแต่เบราว์เซอร์ยอดนิยมเริ่มรองรับเวอร์ชันหลักรุ่นถัดไปของ HTTP อย่าง HTTP/2 หรือที่เรียกสั้นๆ ว่า h2 ผู้คนในวงการเว็บก็เริ่มถามเราว่า Googlebot สามารถรวบรวมข้อมูลผ่านโปรโตคอลเวอร์ชันอัปเกรดที่มีความทันสมัยมากขึ้นได้หรือไม่
วันนี้เราขอประกาศให้ทราบว่าตั้งแต่ช่วงกลางเดือนพฤศจิกายน 2020 เป็นต้นไป Googlebot จะรองรับการรวบรวมข้อมูลผ่าน HTTP/2 สำหรับบางเว็บไซต์
HTTP/2 คืออะไร
อย่างที่เกริ่นไปแล้ว HTTP/2 คือเวอร์ชันหลักรุ่นถัดไปของ HTTP หรือโปรโตคอลที่อินเทอร์เน็ตใช้โอนข้อมูลเป็นหลักนั่นเอง สถาปัตยกรรมของ HTTP/2 ตลอดจนฟีเจอร์ที่ใช้สำหรับไคลเอ็นต์ (เช่น เบราว์เซอร์ของคุณ) และเซิร์ฟเวอร์ต่างๆ ทำให้โปรโตคอลเวอร์ชันนี้มีประสิทธิภาพและรวดเร็วกว่ารุ่นก่อนหน้ามาก หากต้องการอ่านเพิ่มเติม เรามีบทความแบบยาวเรื่อง HTTP/2
ทำไมเราจึงทำการเปลี่ยนแปลงนี้
โดยทั่วไปแล้วเราคาดหวังว่าการเปลี่ยนแปลงนี้จะทำให้รวบรวมข้อมูลได้อย่างมีประสิทธิภาพมากขึ้นในแง่ของการใช้งานทรัพยากรเซิร์ฟเวอร์ Googlebot สามารถเปิดการเชื่อมต่อ TCP รายการเดียวไปยังเซิร์ฟเวอร์เมื่อใช้ h2 และโอนหลายๆ ไฟล์พร้อมกันผ่านโปรโตคอลนี้ได้อย่างมีประสิทธิภาพ แทนที่จะต้องใช้การเชื่อมต่อหลายรายการ ยิ่งเปิดการเชื่อมต่อน้อยลง ก็ยิ่งทำให้เซิร์ฟเวอร์และ Googlebot ใช้ทรัพยากรในการรวบรวมข้อมูลน้อยลงด้วย
วิธีการทำงาน
ในระยะแรก เราจะรวบรวมข้อมูลเว็บไซต์จำนวนหนึ่งผ่าน h2 และจะค่อยๆ เพิ่มจำนวนเว็บไซต์ที่อาจได้รับประโยชน์จากฟีเจอร์ที่รองรับตั้งแต่ต้นอย่างเช่นการขอทำ Multiplex
Googlebot เลือกเว็บไซต์ที่จะรวบรวมข้อมูลผ่าน h2 โดยดูว่าเว็บไซต์รองรับ h2 หรือไม่ และทั้งเว็บไซต์และ Googlebot จะได้รับประโยชน์จากการรวบรวมข้อมูลผ่าน HTTP/2 หรือไม่ หากเซิร์ฟเวอร์ของคุณรองรับ h2 และ Googlebot รวบรวมข้อมูลจากเว็บไซต์ของคุณมาเยอะแล้ว คุณอาจมีสิทธิ์อัปเกรดการเชื่อมต่อโดยที่ไม่ต้องดำเนินการใดๆ
หากเซิร์ฟเวอร์ของคุณยังสื่อสารผ่าน HTTP/1.1 อย่างเดียวก็ไม่เป็นไร การรวบรวมข้อมูลผ่านโปรโตคอลนี้ไม่มีข้อด้อยที่ชัดแจ้ง โดยจะยังคงคุณภาพและปริมาณในระดับเดิม
วิธีการเลือกไม่ใช้
จากการทดสอบเบื้องต้น เราไม่พบปัญหาหรือผลกระทบในแง่ลบต่อการจัดทำดัชนี แต่เราทราบดีว่าคุณอาจต้องการเลือกไม่ใช้การรวบรวมข้อมูลผ่าน HTTP/2 ด้วยเหตุผลต่างๆ ซึ่งคุณเลือกไม่ใช้ได้โดยสั่งให้เซิร์ฟเวอร์ตอบสนองด้วยรหัสสถานะ HTTP 421 เมื่อ Googlebot พยายามรวบรวมข้อมูลเว็บไซต์ของคุณผ่าน h2 หากยังดำเนินการไม่ได้ในตอนนี้ ให้ส่งข้อความถึงทีม Googlebot (แต่นี่เป็นวิธีแก้ปัญหาชั่วคราวเท่านั้น)
หากมีข้อสงสัยเพิ่มเติมเกี่ยวกับ Googlebot และ HTTP/2 โปรดดูคำถามที่เราคาดว่าคุณอาจถาม หากไม่พบคำถามที่ต้องการ โปรดเขียนมาหาเราทาง Twitter และในฟอรัมความช่วยเหลือ
คำถามที่เราคาดว่าคุณอาจถาม
ทำไมคุณจึงอัปเกรด Googlebot ในตอนนี้
ซอฟต์แวร์ที่เราใช้เพื่อทำให้ Googlebot รวบรวมข้อมูลผ่าน h2 มีความเสถียรมากพอที่จะนำมาใช้งานจริง
ฉันต้องอัปเกรดเซิร์ฟเวอร์ของฉันทันทีเลยไหม
จริงๆ แล้วขึ้นอยู่กับคุณเลย แต่เราจะเปลี่ยนไปรวบรวมข้อมูลผ่าน h2 สำหรับเว็บไซต์ที่รองรับและจะได้รับประโยชน์จากโปรโตคอลนี้อย่างชัดเจนเท่านั้น Googlebot จะรวบรวมข้อมูลผ่าน h1 ต่อไปหากไม่พบประโยชน์ที่ชัดเจนของการรวบรวมข้อมูลผ่าน h2
ฉันจะทดสอบได้อย่างไรว่าเว็บไซต์รองรับ h2 หรือไม่
Cloudflare มีบล็อกโพสต์เกี่ยวกับวิธีการต่างๆ มากมายในการทดสอบว่าเว็บไซต์รองรับ h2 หรือไม่ ลองไปศึกษาดูได้
ฉันจะอัปเกรดเว็บไซต์เป็น h2 ได้อย่างไร
เรื่องนี้จะขึ้นอยู่กับเซิร์ฟเวอร์ของคุณ เราขอแนะนำให้สอบถามผู้ดูแลระบบเซิร์ฟเวอร์หรือผู้ให้บริการโฮสติ้ง
ฉันจะทำให้ Googlebot รวบรวมข้อมูลเว็บไซต์ผ่าน h2 ได้อย่างไร
คุณทำไม่ได้ หากเว็บไซต์รองรับ h2 ก็จะมีสิทธิ์ได้รับการรวบรวมข้อมูลผ่าน h2 แต่เฉพาะในกรณีเว็บไซต์และ Googlebot จะได้รับประโยชน์จากการรวบรวมข้อมูลผ่านโปรโตคอลดังกล่าวเท่านั้น ตัวอย่างเช่น หากการรวบรวมข้อมูลผ่าน h2 ไม่ช่วยให้ใช้ทรัพยากรน้อยลงอย่างเห็นได้ชัด เราก็จะรวบรวมข้อมูลเว็บไซต์ผ่าน HTTP/1.1 ต่อไป
ทำไมคุณจึงไม่รวบรวมข้อมูลเว็บไซต์ที่เปิดใช้ h2 ทั้งหมดผ่าน h2
จากที่ประเมินดูแล้ว เราพบว่าเว็บไซต์บางแห่งได้รับประโยชน์เพียงเล็กน้อยหรือไม่ได้รับประโยชน์เลย (เช่น เว็บไซต์ที่มี QPS ต่ำมาก) เมื่อรวบรวมข้อมูลผ่าน h2 เราจึงตัดสินใจที่จะเปลี่ยนไปรวบรวมข้อมูลผ่าน h2 เมื่อเว็บไซต์ได้รับประโยชน์อย่างชัดเจนเท่านั้น เราจะประเมินประสิทธิภาพที่ได้รับกันต่อไปและอาจเปลี่ยนแปลงเกณฑ์การรวบรวมข้อมูลผ่าน h2 ในอนาคต
ฉันจะทราบได้อย่างไรว่าเว็บไซต์ได้รับการรวบรวมข้อมูลผ่าน h2
เมื่อเว็บไซต์มีสิทธิ์สำหรับการรวบรวมข้อมูลผ่าน h2 เจ้าของเว็บไซต์ดังกล่าวที่ลงทะเบียนใน Search Console จะได้รับข้อความแจ้งว่าจากนี้ไปอาจมีการเข้ารวบรวมข้อมูลบางส่วนผ่าน h2 คุณยังตรวจสอบในบันทึกเซิร์ฟเวอร์ได้ด้วย (เช่น ในไฟล์ access.log หากคุณเรียกใช้เว็บไซต์บน Apache)
Googlebot รองรับฟีเจอร์ใดของ h2 บ้าง
Googlebot รองรับฟีเจอร์ส่วนใหญ่ที่ h2 มี ส่วนฟีเจอร์บางอย่าง เช่น พุชจากเซิร์ฟเวอร์ ซึ่งอาจมีประโยชน์ต่อการแสดงภาพ ยังอยู่ระหว่างการประเมิน
Googlebot รองรับ HTTP/2 แบบข้อความธรรมดา (h2c) ไหม
ไม่ เว็บไซต์ต้องใช้ HTTPS และรองรับ HTTP/2 จึงจะมีสิทธิ์สำหรับการรวบรวมข้อมูลผ่าน HTTP/2 ซึ่งเทียบเท่ากับวิธีที่เบราว์เซอร์ที่ทันสมัยทำ
Googlebot จะใช้ส่วนขยาย ALPN เพื่อเลือกเวอร์ชันโปรโตคอลที่จะใช้รวบรวมข้อมูลไหม
การเจรจาต่อรองโปรโตคอลในเลเยอร์แอปพลิเคชัน (ALPN) จะใช้สำหรับเว็บไซต์ที่เลือกใช้การรวบรวมข้อมูลผ่าน h2 เท่านั้น และโปรโตคอลเดียวที่ยอมรับสำหรับการตอบสนองจะต้องเป็น h2 หากเซิร์ฟเวอร์ตอบสนองระหว่างการแฮนด์เชค TLS ด้วยโปรโตคอลเวอร์ชันอื่นที่ไม่ใช่ h2 จะทำให้ Googlebot ไม่รวบรวมข้อมูลแล้วค่อยกลับมาใหม่ผ่านทาง HTTP/1.1
ฟีเจอร์ต่างๆ ของ h2 จะช่วยรวบรวมข้อมูลอย่างไร
ประโยชน์ที่โดดเด่นที่สุดส่วนหนึ่งของ h2 ได้แก่
- การทำ Multiplex และการเกิดขึ้นพร้อมกัน: การเปิดการเชื่อมต่อ TCP น้อยลงจะทำให้มีการใช้ทรัพยากรน้อยลงด้วย
- การบีบอัดส่วนหัว: ขนาดส่วนหัว HTTP ที่ลดลงอย่างมากจะช่วยประหยัดทรัพยากร
- พุชจากเซิร์ฟเวอร์: เรายังไม่เปิดใช้ฟีเจอร์นี้ เนื่องจากยังอยู่ในระยะของการประเมิน ฟีเจอร์นี้อาจเป็นประโยชน์สำหรับการแสดงภาพ แต่เรายังไม่มีความเห็นที่เจาะจงเกี่ยวกับฟีเจอร์นี้ในขณะนี้
หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับฟีเจอร์เฉพาะของ h2 และความเกี่ยวข้องกับการรวบรวมข้อมูล โปรดส่งคำถามมาทาง Twitter
Googlebot จะรวบรวมข้อมูลผ่าน h2 ได้มากขึ้นหรือเร็วขึ้นไหม
ประโยชน์หลักของ h2 คือการประหยัดทรัพยากร ทั้งฝั่งเซิร์ฟเวอร์และฝั่ง Googlebot ไม่ว่าเราจะรวบรวมข้อมูลผ่าน h1 หรือ h2 ก็ไม่ส่งผลต่อวิธีการจัดทำดัชนีเว็บไซต์ ดังนั้นจึงไม่ส่งผลต่อปริมาณข้อมูลที่เราวางแผนว่าจะรวบรวมจากเว็บไซต์ของคุณ
การรวบรวมข้อมูลผ่าน h2 มีข้อดีต่อการจัดอันดับของเว็บไซต์ไหม
ไม่มี