รวม URL ที่ซ้ำกัน

หากคุณมีหน้าเว็บเดียวที่เข้าถึงได้จาก URL หลายรายการ หรือมีหน้าเว็บหลายหน้าที่มีเนื้อหาคล้ายกัน (เช่น หน้าเว็บที่มีทั้งรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป) Google จะมองว่าเป็นเวอร์ชันที่ซ้ำของหน้าเว็บเดียวกัน Google จะเลือก URL 1 รายการเป็นเวอร์ชัน Canonical และรวบรวมข้อมูลจาก URL ดังกล่าว และถือว่า URL อื่นๆ ทั้งหมดเป็น URL ที่ซ้ำ และจะรวบรวมข้อมูลจาก URL อื่นเหล่านั้นไม่บ่อย

หากคุณไม่ได้บอก Google ว่า URL ใดเป็น Canonical URL ไว้อย่างชัดแจ้ง Google จะเลือกให้เอง หรืออาจพิจารณาทั้ง URL ที่เราเลือกและที่คุณเลือกโดยให้น้ำหนักเท่ากัน ซึ่งอาจทำให้เกิดลักษณะการทำงานที่ไม่พึงประสงค์ตามที่อธิบายไว้ด้านล่างในเพราะเหตุใดฉันถึงควรเลือก Canonical URL

Canonical URL คืออะไร

Canonical URL คือ URL ของหน้าที่ Google คิดว่าเป็นตัวแทนที่ดีที่สุดของหน้าต่างๆ ที่ซ้ำกันในเว็บไซต์ของคุณ ตัวอย่างเช่น หากคุณมี URL หลายรายการสําหรับหน้าเดียวกัน (เช่น example.com?dress=1234 และ example.com/dresses/1234) Google จะเลือก URL หนึ่งเป็น Canonical URL โปรดทราบว่าหน้าที่ซ้ำกันไม่จำเป็นจะต้องเหมือนกันทุกประการ การจัดเรียงหรือการกรองหน้ารายการที่เปลี่ยนแปลงเล็กน้อยไม่ได้ทำให้หน้าแตกต่างกัน (เช่น การจัดเรียงตามราคาหรือการกรองตามสีของรายการ)

หน้า Canonical อาจอยู่คนละโดเมนกับหน้าที่ซ้ำกันก็ได้

รายละเอียดเพิ่มเติม

เมื่อจัดทำดัชนีเว็บไซต์ Googlebot จะพยายามระบุเนื้อหาหลักของแต่ละหน้า หากพบว่าในเว็บไซต์เดียวกันมีหลายหน้าที่อาจมีเนื้อหาเหมือนกัน Googlebot จะเลือกหน้าที่คิดว่าสมบูรณ์และมีประโยชน์มากที่สุดและทำเครื่องหมายเป็นหน้า Canonical ระบบจะรวบรวมข้อมูลหน้า Canonical เป็นประจำให้บ่อยที่สุด และรวบรวมข้อมูลหน้าที่ซ้ำน้อยครั้งกว่า เพื่อลดปริมาณงานของ Google ในการรวบรวมข้อมูลจากเว็บไซต์ของคุณ

Google เลือกหน้า Canonical โดยพิจารณาจากปัจจัย (หรือสัญญาณ) หลายประการ เช่น หน้าเว็บแสดงผ่าน http หรือ https, คุณภาพหน้าเว็บ, การแสดง URL ในแผนผังเว็บไซต์ และการติดป้ายกำกับ rel=canonical คุณระบุความต้องการให้ Google ทราบได้โดยใช้เทคนิคเหล่านี้ แต่ Google อาจเลือกหน้า Canonical คนละหน้ากับที่คุณเลือกไว้เมื่อพิจารณาเหตุผลต่างๆ แล้ว

หน้าที่เป็นเวอร์ชันภาษาต่างๆ ของหน้าหนึ่งๆ จะถือว่าซ้ำกันต่อเมื่อเนื้อหาหลักเป็นภาษาเดียวกันเท่านั้น (นั่นคือระบบจะพิจารณาว่าหน้าซ้ำเมื่อมีการแปลเฉพาะส่วนหัว ส่วนท้าย และข้อความที่ไม่สำคัญอื่นๆ แต่เนื้อหายังคงเหมือนเดิม)

Google ใช้หน้า Canonical เป็นแหล่งที่มาหลักในการประเมินเนื้อหาและคุณภาพ โดยปกติแล้วผลการค้นหาของ Google Search จะนำไปยังหน้า Canonical ยกเว้นกรณีที่หน้าเว็บที่ซ้ำกันมีหน้าที่เหมาะสมกับผู้ใช้มากกว่า เช่น ผลการค้นหาอาจนำไปยังหน้าสำหรับอุปกรณ์เคลื่อนที่หากผู้ใช้กำลังใช้อุปกรณ์เคลื่อนที่อยู่ แม้ว่าหน้าสำหรับเดสก์ท็อปจะมีการทำเครื่องหมายเป็นหน้า Canonical ก็ตาม

เพราะเหตุใดฉันจึงมีหน้าเว็บคล้ายกัน/ซ้ำกัน

มีสาเหตุหลายประการที่ทำให้เว็บไซต์อาจมี URL ต่างกันแต่นำไปยังหน้าเว็บเดียวกัน หรือ URL ต่างๆ กันมีหน้าเว็บซ้ำกันหรือคล้ายกันมาก ต่อไปนี้คือสาเหตุที่พบมากที่สุด

  • เพื่อรองรับอุปกรณ์ประเภทต่างๆ เช่น
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • เพื่อเปิดใช้ URL แบบไดนามิกสำหรับสิ่งต่างๆ เช่น พารามิเตอร์การค้นหาหรือรหัสเซสชัน ตัวอย่างเช่น
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • หากระบบของบล็อกบันทึก URL หลายรายการโดยอัตโนมัติเมื่อคุณวางโพสต์เดียวกันในหลายๆ ส่วน
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • หากมีการกำหนดค่าเซิร์ฟเวอร์ให้แสดงเนื้อหาเดียวกันสำหรับรูปแบบ http หรือ https ที่มี www หรือไม่มี www เช่น
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • หากเนื้อหาที่คุณมีให้ในบล็อกสำหรับการเผยแพร่ไปยังเว็บไซต์อื่นมีการทำซ้ำบางส่วนหรือทั้งหมดในโดเมนเหล่านั้น เช่น
    https://news.example.com/green-dresses-for-every-day-155672.html (โพสต์ที่เผยแพร่) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (โพสต์ต้นฉบับ)

เพราะเหตุใดฉันถึงควรเลือก Canonical URL

มีเหตุผลหลายประการที่ควรเลือก หน้า Canonical อย่างชัดแจ้งในหน้าที่ซ้ำกัน/คล้ายกันหลายหน้า ดังนี้

  • เพื่อระบุ URL ที่ต้องการให้ผู้ใช้เห็นในผลการค้นหา คุณอาจต้องการให้ผู้ใช้เข้าถึงหน้าผลิตภัณฑ์ชุดกระโปรงสีเขียวผ่าน https://www.example.com/dresses/green/greendress.html ไม่ใช่ https://example.com/dresses/cocktail?gclid=ABCD
  • เพื่อรวมสัญญาณลิงก์ของหน้าที่คล้ายกันหรือซ้ำกัน ซึ่งจะช่วยให้เครื่องมือค้นหารวมข้อมูลของ URL (เช่น ลิงก์ที่เชื่อมไปยังเนื้อหา) แต่ละรายการไว้ใน URL เดียวที่ต้องการได้ นั่นหมายความว่าลิงก์จากเว็บไซต์อื่นที่ชี้ไปยัง http://example.com/dresses/cocktail?gclid=ABCD จะรวมเข้ากับลิงก์ไปยัง https://www.example.com/dresses/green/greendress.html
  • เพื่อลดความซับซ้อนของเมตริกการติดตามสำหรับผลิตภัณฑ์/หัวข้อเดียว URL ที่หลากหลายทำให้การรวมเมตริกสำหรับเนื้อหาเฉพาะเจาะจงเป็นเรื่องท้าทายมากขึ้น
  • เพื่อจัดการเนื้อหาที่คัดลอกมา หากคัดลอกเนื้อหาของตนเองเพื่อเผยแพร่ในโดเมนอื่นๆ คุณอาจต้องการตรวจสอบให้แน่ใจว่า URL ดังกล่าวจะปรากฏในผลการค้นหา
  • เพื่อหลีกเลี่ยงการใช้เวลาในการรวบรวมข้อมูลจากหน้าที่ซ้ำกัน คุณต้องการให้ Googlebot ใช้ประโยชน์สูงสุดจากเว็บไซต์ จึงควรให้ Googlebot ใช้เวลาในการรวบรวมข้อมูลหน้าเว็บใหม่ (หรือหน้าที่อัปเดต) ในเว็บไซต์มากกว่าที่จะรวบรวมข้อมูลหน้าเว็บเดียวกันในรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่

Canonical URL ที่ Google เลือกไว้คือหน้าไหน

ใช้เครื่องมือตรวจสอบ URL เพื่อดูว่า Google มองว่าหน้าใดเป็นหน้า Canonical โปรดทราบว่าแม้ว่าคุณจะระบุหน้า Canonical ไว้อย่างชัดแจ้ง แต่ Google อาจเลือกหน้าอื่นเป็นหน้า Canonical ด้วยเหตุผลต่างๆ อย่างการพิจารณาประสิทธิภาพหรือเนื้อหา

การแก้ปัญหา

หาก Canonical URL อยู่ในพร็อพเพอร์ตี้ที่คุณไม่ได้เป็นเจ้าของ คุณจะไม่เห็นปริมาณการเข้าชมสำหรับหน้าเว็บที่ซ้ำกัน เหตุผลทั่วไปที่ทำให้ Canonical URL อาจอยู่ในพร็อพเพอร์ตี้แยกกันมีดังนี้

  • รูปแบบภาษาที่ทำเครื่องหมายไว้ไม่ถูกต้อง: หากคุณมีหลายเว็บไซต์ที่มีเนื้อหาโดยส่วนใหญ่เหมือนกันโดยแปลเป็นภาษาต่างๆ สำหรับผู้ใช้ทั่วโลก โปรดตรวจสอบว่าคุณปฏิบัติตามหลักเกณฑ์สำหรับเว็บไซต์ที่แปลเป็นภาษาท้องถิ่น
  • แท็ก Canonical ที่ไม่ถูกต้อง: ระบบจัดการเนื้อหา (CMS) บางระบบ หรือปลั๊กอิน CMS อาจใช้เทคนิคการกำหนดหน้า Canonical เพื่อชี้ไปยัง URL ในเว็บไซต์ภายนอกอย่างไม่ถูกต้อง ตรวจสอบเนื้อหาของคุณเพื่อดูว่าเป็นกรณีนี้หรือไม่ หากเว็บไซต์แสดงให้เห็นการเลือก Canonical URL ที่ไม่ตรงกับที่คุณคาดไว้ ก็อาจเป็นเพราะการใช้ rel="canonical" หรือการเปลี่ยนเส้นทาง 301 อย่างไม่ถูกต้อง ให้แก้ไขปัญหานั้นโดยตรง
  • เซิร์ฟเวอร์ที่กำหนดค่าผิดพลาด: การกำหนดค่าโฮสติ้งบางอย่างที่ไม่ถูกต้องอาจเป็นสาเหตุให้เกิดการเลือก URL ข้ามโดเมนที่ไม่ตรงกับที่คาดไว้ เช่น
    • เซิร์ฟเวอร์อาจมีการกำหนดค่าผิดพลาดให้แสดงเนื้อหาจาก a.com เพื่อตอบสนองต่อคำขอ URL ใน b.com
    • เว็บเซิร์ฟเวอร์ 2 รายการที่ไม่เกี่ยวข้องกันอาจจะแสดงผลหน้า Soft 404 ที่เหมือนกันซึ่ง Google ระบุไม่ได้ว่าเป็นหน้าข้อผิดพลาด
  • การแฮ็กที่ประสงค์ร้าย: การโจมตีเว็บไซต์บางครั้งทำให้เกิดโค้ดที่แสดงการเปลี่ยนเส้นทาง 301 ของ HTTP หรือแทรกเอลิเมนต์ของลิงก์ rel="canonical" แบบข้ามโดเมนเข้าไปใน <head> แบบ HTML หรือส่วนหัว HTTP ซึ่งโดยปกติจะชี้ไปยัง URL ที่โฮสต์เนื้อหาที่ประสงค์ร้ายหรือเป็นสแปม ในกรณีเหล่านี้ อัลกอริทึมของเราอาจเลือก URL ที่ประสงค์ร้ายหรือที่เป็นสแปมแทนที่จะเป็น URL ในเว็บไซต์ที่ถูกบุกรุก
  • เว็บไซต์เลียนแบบ: ในบางสถานการณ์ซึ่งพบได้น้อย อัลกอริทึมของเราอาจเลือก URL จากเว็บไซต์ภายนอกที่โฮสต์เนื้อหาโดยไม่ได้รับอนุญาตจากคุณ หากเชื่อว่าเว็บไซต์อื่นกำลังทำซ้ำเนื้อหาของคุณซึ่งเป็นการละเมิดกฎหมายลิขสิทธิ์ คุณอาจติดต่อโฮสต์ของเว็บไซต์เพื่อขอให้นำออกได้ นอกจากนี้ คุณขอให้ Google นำหน้าที่ละเมิดออกจากผลการค้นหาของเราได้โดยยื่นคำขอภายใต้ Digital Millennium Copyright Act

ระบุหน้า Canonical

การระบุหน้า Canonical ในหน้าที่ซ้ำกันจำนวนมากมีด้วยกัน 2-3 วิธี ขึ้นอยู่กับการใช้งาน ดังนี้

วิธีและคำอธิบาย
หลักเกณฑ์ทั่วไป ทำตามหลักเกณฑ์ต่อไปนี้สำหรับวิธีทั้งหมดในการกำหนดหน้า Canonical
แท็ก rel=canonical <link>

เพิ่มแท็ก <link> ในโค้ดสำหรับหน้าที่ซ้ำกันทั้งหมดที่ชี้ไปยังหน้า Canonical

ข้อดี:

  • แมปหน้าที่ซ้ำกันได้ไม่จำกัดจำนวน

ข้อเสีย:

  • ขนาดของหน้าเว็บอาจเพิ่มขึ้น
  • การรักษาการแมปในเว็บไซต์ขนาดใหญ่หรือเว็บไซต์ที่มีการเปลี่ยนแปลง URL บ่อยๆ อาจซับซ้อน
  • ใช้งานได้เฉพาะกับหน้า HTML ไม่ใช่สำหรับไฟล์ เช่น PDF ในกรณีเช่นนี้คุณใช้ส่วนหัว HTTP ของ rel=canonical ได้
ส่วนหัว HTTP ของ rel=canonical

ส่งส่วนหัว rel=canonical ในการตอบกลับของหน้าเว็บ

ข้อดี:

  • ขนาดหน้าไม่เพิ่มขึ้น
  • แมปหน้าที่ซ้ำกันได้ไม่จำกัดจำนวน

ข้อเสีย:

  • การรักษาการแมปในเว็บไซต์ขนาดใหญ่หรือเว็บไซต์ที่มีการเปลี่ยนแปลง URL บ่อยๆ อาจซับซ้อน
แผนผังเว็บไซต์

ระบุหน้า Canonical ในแผนผังเว็บไซต์

ข้อดี:

  • ดำเนินการและบำรุงรักษาได้ง่ายโดยเฉพาะอย่างยิ่งในเว็บไซต์ขนาดใหญ่

ข้อเสีย:

  • Googlebot ยังคงต้องระบุหน้าเว็บที่ซ้ำกันที่เกี่ยวข้องสำหรับหน้า Canonical ใดก็ตามที่คุณประกาศในแผนผังเว็บไซต์
  • สัญญาณที่ส่งไปยัง Googlebot มีความสำคัญน้อยกว่าเทคนิคการแมปแบบ rel=canonical
การเปลี่ยนเส้นทาง 301 ใช้การเปลี่ยนเส้นทาง 301 เพื่อแจ้งให้ Googlebot ทราบว่า URL เปลี่ยนเส้นทางเป็นเวอร์ชันที่ดีกว่า URL ที่ระบุ ใช้ตัวเลือกนี้เฉพาะเมื่อเลิกใช้หน้าที่ซ้ำ
รูปแบบ AMP หากมีตัวแปรที่เป็นหน้า AMP คุณจะต้องปฏิบัติตามหลักเกณฑ์ AMP เพื่อระบุหน้า Canonical และรูปแบบ AMP

แม้เราจะสนับสนุนให้คุณใช้วิธีการเหล่านี้ แต่เราก็ไม่ได้บังคับคุณ หากคุณไม่ได้ระบุ Canonical URL เราจะระบุเวอร์ชันหรือ URL ที่เราคิดว่าดีที่สุด

หลักเกณฑ์ทั่วไป

สำหรับวิธีกำหนดหน้า Canonical ทั้งหมด ให้ทำตามหลักเกณฑ์ทั่วไปเหล่านี้

หลักเกณฑ์ทั่วไป

  • อย่าใช้ไฟล์ robots.txt ในการกําหนดหน้า Canonical
  • อย่าใช้เครื่องมือนำ URL ออกเพื่อจุดประสงค์ในการกำหนดหน้า Canonical เพราะจะเป็นการนำ URL ทุกเวอร์ชันออกจากการค้นหา
  • อย่าระบุ URL ที่ต่างกันเป็น Canonical สำหรับหน้าเว็บเดียวกันโดยใช้เทคนิคการกำหนดหน้า Canonical ที่ต่างกันหรือเหมือนกัน (เช่น อย่าระบุ URL หนึ่งในแผนผังเว็บไซต์ แต่ระบุ URL อื่นสำหรับหน้าเดียวกันนั้นโดยใช้ rel="canonical")
  • อย่าใช้ noindex เป็นวิธีป้องกันการเลือกหน้า Canonical คำสั่งนี้มีจุดประสงค์เพื่อยกเว้นหน้าจากดัชนี ไม่ใช่เพื่อจัดการกับตัวเลือกของหน้า Canonical
  • ระบุหน้า Canonical เมื่อใช้แท็ก hreflang ระบุหน้า Canonical ที่ใช้ภาษาเดียวกัน หรือใช้ภาษาทดแทนที่ดีที่สุดหากไม่มีหน้า Canonical สำหรับภาษาเดียวกันนั้น

  • ลิงก์ไปยัง Canonical URL แทนการลิงก์ไปยัง URL ของหน้าที่ซ้ำกัน เวลาลิงก์ภายในเว็บไซต์ การลิงก์ไปยัง URL ที่คุณเลือกให้เป็นหน้า Canonical อย่างสอดคล้องกันช่วยให้ Google เข้าใจสิ่งที่คุณต้องการ

ใช้ HTTPS กับ Canonical URL แทนที่จะใช้ HTTP

Google จะเลือกหน้า HTTPS เป็นหน้า Canonical แทนที่จะเลือกหน้า HTTP ที่เทียบเท่ากัน ยกเว้นในกรณีที่มีปัญหาหรือสัญญาณที่บอกถึงความขัดแย้งกัน เช่น

  • หน้า HTTPS มีใบรับรอง SSL ที่ไม่ถูกต้อง
  • หน้า HTTPS มีการขึ้นต่อกันที่ไม่ปลอดภัย (นอกเหนือจากภาพ)
  • หน้า HTTPS เปลี่ยนเส้นทางผู้ใช้ไปยังหรือผ่านหน้า HTTP
  • หน้า HTTPS มีลิงก์ rel="canonical" ไปยังหน้า HTTP

แม้ว่าโดยค่าเริ่มต้น ระบบของเราจะเลือกใช้หน้า HTTPS แทนหน้า HTTP แต่จะดำเนินการต่อไปนี้เพื่อให้มั่นใจว่าเราจะเลือกใช้ HTTPS ก็ได้

  • เพิ่มการเปลี่ยนเส้นทางจากหน้า HTTP ไปยังหน้า HTTPS
  • เพิ่มลิงก์ rel="canonical" จากหน้า HTTP ไปยังหน้า HTTPS
  • ใช้ HSTS

หากต้องการป้องกันไม่ให้ Google ทำให้หน้า HTTP เป็นหน้า Canonical อย่างไม่ถูกต้อง คุณควรหลีกเลี่ยงการปฏิบัติดังต่อไปนี้

  • ใบรับรอง SSL ที่ไม่ถูกต้องและการเปลี่ยนเส้นทางจาก HTTPS ไปยัง HTTP ส่งผลให้เราเลือก HTTP เป็น Canonical ได้อย่างไม่ถูกต้อง และการนำ HSTS มาใช้ก็จะไม่ช่วยลบล้างค่ากำหนดดังกล่าว
  • การรวมหน้า HTTP ไว้ในแผนผังเว็บไซต์หรือรายการ hreflang แทนที่จะรวมเวอร์ชัน HTTPS
  • การใช้ใบรับรอง SSL/TLS กับรูปแบบโฮสต์ที่ไม่ตรงกัน เช่น example.com แสดงใบรับรองของ www.example.com ใบรับรองนี้ต้องระบุข้อมูลตรงกับ URL เว็บไซต์ที่สมบูรณ์ของคุณ หรือเป็นใบรับรองแบบไวลด์การ์ดที่ใช้กับโดเมนย่อยหลายรายการในโดเมนได้

ผู้ใช้ขั้นสูงเท่านั้น: บอก Google ให้เพิกเฉยต่อพารามิเตอร์แบบไดนามิก

ใช้การจัดการพารามิเตอร์เพื่อบอก Googlebot เกี่ยวกับพารามิเตอร์ทั้งหมดที่ควรเพิกเฉยเมื่อรวบรวมข้อมูล การเพิกเฉยต่อพารามิเตอร์บางตัวจะช่วยลดเนื้อหาที่ซ้ำกันในดัชนีของ Google และทำให้รวบรวมข้อมูลในเว็บไซต์ได้ดีขึ้น ตัวอย่างเช่น หากคุณระบุให้เพิกเฉยต่อพารามิเตอร์ sessionid ไว้ Googlebot จะถือว่า URL 2 รายการต่อไปนี้ซ้ำกัน

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

วิธีที่เฉพาะเจาะจง

เลือกวิธีใดวิธีหนึ่งต่อไปนี้เพื่อระบุ Canonical URL สำหรับ URL ที่ซ้ำกัน หรือหน้าเว็บที่ซ้ำกัน/คล้ายกัน

โปรดปฏิบัติตามหลักเกณฑ์ทั่วไปด้านบนไม่ว่าจะใช้วิธีใดก็ตาม

คุณใช้แท็ก <link> ในส่วนหัวของหน้าได้เพื่อบอกให้ทราบเมื่อมีหน้าเว็บซ้ำกัน

สมมติว่าคุณต้องการให้ https://example.com/dresses/green-dresses เป็น Canonical URL แม้ว่าจะมี URL หลายรายการที่เข้าถึงเนื้อหานี้ได้ก็ตาม ระบุ URL นี้เป็น Canonical ตามขั้นตอนต่อไปนี้

  1. ทำเครื่องหมายหน้าเว็บที่ซ้ำกันทั้งหมดด้วยเอลิเมนต์ของลิงก์ rel="canonical" เพิ่มเอลิเมนต์ <link> ที่มีแอตทริบิวต์ rel="canonical" ลงในส่วน <head> ของหน้าที่ซ้ำกัน ซึ่งชี้ไปยังหน้า Canonical ดังเช่นตัวอย่างนี้
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. หากหน้า Canonical มีรุ่นอุปกรณ์เคลื่อนที่ ให้เพิ่มลิงก์ rel="alternate" ไปยังหน้ารุ่นอุปกรณ์เคลื่อนที่ ดังนี้
    <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

  3. เพิ่ม hreflang หรือการเปลี่ยนเส้นทางอื่นๆ ที่เหมาะสำหรับหน้านั้น

ใช้ส่วนหัว HTTP ของ rel="canonical"

หากกำหนดค่าเซิร์ฟเวอร์ได้ คุณอาจใช้ส่วนหัว HTTP rel="canonical" (แทนแท็ก HTML) เพื่อระบุ Canonical URL สำหรับเอกสารที่ไม่ใช่ HTML เช่น ไฟล์ PDF

ตัวอย่างเช่น หากแสดงไฟล์ PDF ไฟล์หนึ่งใน URL หลายรายการ คุณจะส่งส่วนหัว rel="canonical" ของ HTTP เช่น ส่วนหัวต่อไปนี้สำหรับ URL ที่ซ้ำกันกลับมาได้ เพื่อแจ้ง Googlebot ว่า URL ใดคือ Canonical URL สำหรับไฟล์ PDF ดังกล่าว

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

ขณะนี้ Google รองรับวิธีการนี้สำหรับผลการค้นหาเว็บเท่านั้น

ใช้แผนผังเว็บไซต์

เลือก Canonical URL สำหรับหน้าเว็บแต่ละหน้า และส่ง URL เหล่านั้นผ่านแผนผังเว็บไซต์ ระบบจะมองว่าหน้าเว็บทั้งหมดที่ระบุในแผนผังเว็บไซต์เป็นหน้า Canonical และ Googlebot จะเป็นผู้ตัดสินว่าหน้าเว็บใดซ้ำกัน (ถ้ามี) โดยพิจารณาจากความคล้ายคลึงกันของเนื้อหา

เราไม่รับประกันว่าจะถือว่า URL ในแผนผังเว็บไซต์เป็น Canonical URL แต่มองเป็นวิธีง่ายๆ ในการกำหนด Canonical URL สำหรับเว็บไซต์ขนาดใหญ่ และแผนผังเว็บไซต์ก็เป็นวิธีที่มีประโยชน์ในการแจ้งให้ Google ทราบถึงหน้าเว็บที่คุณมองว่าสำคัญที่สุดในเว็บไซต์ของคุณ

อย่ารวมหน้าที่ไม่ใช่หน้า Canonical ไว้ในแผนผังเว็บไซต์ หากใช้แผนผังไซต์ ให้ระบุเฉพาะ Canonical URL ในแผนผังไซต์เท่านั้น

ใช้การเปลี่ยนเส้นทาง 301 สำหรับ URL ที่เลิกใช้แล้ว

ใช้วิธีการนี้เมื่อคุณต้องการกำจัดหน้าเว็บซ้ำที่มีอยู่ แต่ควรตรวจสอบว่าการเปลี่ยนผ่านไปยัง URL ใหม่ใช้ได้ก่อนที่จะเลิกใช้ URL เก่า

สมมติว่าการเข้าถึงหน้าเว็บทำได้หลายวิธี โปรดคำนึงถึงข้อมูลต่อไปนี้

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

ให้เลือก URL เหล่านั้นรายการใดรายการหนึ่งเป็น Canonical URL และใช้การเปลี่ยนเส้นทาง 301 เพื่อส่งการเข้าชมจาก URL อื่นๆ ไปยัง URL ที่คุณต้องการ การเปลี่ยนเส้นทาง 301 ทางฝั่งเซิร์ฟเวอร์คือวิธีที่ดีสุดที่ช่วยให้แน่ใจว่ามีการเปลี่ยนเส้นทางผู้ใช้และเครื่องมือค้นหาไปยังหน้าที่ถูกต้อง รหัสสถานะ 301 หมายถึงหน้าเว็บได้ย้ายไปยังตำแหน่งที่ตั้งใหม่เป็นการถาวร

ถ้าคุณใช้บริการโฮสต์เว็บไซต์ ให้ค้นหาเอกสารประกอบการตั้งค่าการเปลี่ยนเส้นทาง 301 ของบริการดังกล่าว