รวม URL ที่ซ้ำกัน

หากคุณมีหน้าเว็บเดียวที่เข้าถึงได้จาก URL หลายรายการ หรือมีหน้าเว็บหลายหน้าที่มีเนื้อหาคล้ายกัน (เช่น หน้าเว็บที่มีทั้งรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป) Google จะมองว่าเป็นเวอร์ชันที่ซ้ำของหน้าเว็บเดียวกัน Google จะเลือก URL 1 รายการเป็นเวอร์ชัน Canonical และรวบรวมข้อมูลจาก URL ดังกล่าว และถือว่า URL อื่นๆ ทั้งหมดเป็น URL ที่ซ้ำ และจะรวบรวมข้อมูลจาก URL อื่นเหล่านั้นไม่บ่อย

หากคุณไม่ได้บอก Google ว่า URL ใดเป็น Canonical URL ไว้อย่างชัดแจ้ง Google จะเลือกให้เอง หรืออาจพิจารณาทั้ง URL ที่เราเลือกและที่คุณเลือกโดยให้น้ำหนักเท่ากัน ซึ่งอาจทำให้เกิดลักษณะการทำงานที่ไม่พึงประสงค์ตามที่อธิบายไว้ด้านล่างในเหตุผลที่ใช้ในการเลือก Canonical URL

วิธีที่ Googlebot จัดทำดัชนีและเลือก Canonical URL

เมื่อจัดทำดัชนีเว็บไซต์ Googlebot จะพยายามระบุเนื้อหาหลักของแต่ละหน้า หากพบว่าในเว็บไซต์เดียวกันมีหลายหน้าที่ดูเหมือนกัน Googlebot จะเลือกหน้าที่คิดว่าสมบูรณ์และมีประโยชน์มากที่สุด แล้วทำเครื่องหมายเป็นหน้า Canonical ระบบจะรวบรวมข้อมูลหน้า Canonical ให้เป็นประจำที่สุด และรวบรวมข้อมูลหน้าที่ซ้ำน้อยครั้งกว่า เพื่อลดปริมาณงานของ Google ในการรวบรวมข้อมูลจากเว็บไซต์ของคุณ

Google เลือกหน้า Canonical โดยพิจารณาจากปัจจัย (หรือสัญญาณ) หลายประการ เช่น หน้าเว็บแสดงผ่าน http หรือ https, คุณภาพหน้าเว็บ, การแสดง URL ในแผนผังเว็บไซต์ และการติดป้ายกำกับ rel=canonical คุณระบุความต้องการให้ Google ทราบได้โดยใช้เทคนิคเหล่านี้ แต่ Google อาจเลือกหน้า Canonical คนละหน้ากับที่คุณเลือกไว้เมื่อพิจารณาเหตุผลต่างๆ แล้ว

หน้าที่เป็นเวอร์ชันภาษาต่างๆ ของหน้าหนึ่งๆ จะถือว่าซ้ำกันต่อเมื่อเนื้อหาหลักเป็นภาษาเดียวกันเท่านั้น (นั่นคือระบบจะพิจารณาว่าหน้าซ้ำเมื่อมีการแปลเฉพาะส่วนหัว ส่วนท้าย และข้อความที่ไม่สำคัญอื่นๆ แต่เนื้อหายังคงเหมือนเดิม)

Google ใช้หน้า Canonical เป็นแหล่งที่มาหลักในการประเมินเนื้อหาและคุณภาพ โดยปกติแล้วผลการค้นหาของ Google Search จะนำไปยังหน้า Canonical ยกเว้นกรณีที่หน้าเว็บที่ซ้ำกันมีหน้าที่เหมาะสมกับผู้ใช้มากกว่า เช่น ผลการค้นหาอาจนำไปยังหน้าสำหรับอุปกรณ์เคลื่อนที่หากผู้ใช้กำลังใช้อุปกรณ์เคลื่อนที่อยู่ แม้ว่าหน้าสำหรับเดสก์ท็อปจะมีการทำเครื่องหมายเป็นหน้า Canonical ก็ตาม

สาเหตุที่มีการเก็บหน้าที่คล้ายกันหรือซ้ำกันไว้

มีสาเหตุหลายประการที่ทำให้เว็บไซต์อาจมี URL ต่างกันแต่นำไปยังหน้าเว็บเดียวกัน หรือ URL ต่างๆ กันมีหน้าเว็บซ้ำกันหรือคล้ายกันมาก ต่อไปนี้คือสาเหตุที่พบมากที่สุด

  • เพื่อรองรับอุปกรณ์ประเภทต่างๆ เช่น
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • เพื่อเปิดใช้ URL แบบไดนามิกสำหรับสิ่งต่างๆ เช่น พารามิเตอร์การค้นหาหรือรหัสเซสชัน ตัวอย่างเช่น
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • หากระบบของบล็อกบันทึก URL หลายรายการโดยอัตโนมัติเมื่อคุณวางโพสต์เดียวกันในหลายๆ ส่วน
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • หากมีการกำหนดค่าเซิร์ฟเวอร์ให้แสดงเนื้อหาเดียวกันสำหรับรูปแบบ http หรือ https ที่มี www หรือไม่มี www เช่น
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • หากเนื้อหาที่คุณมีให้ในบล็อกสำหรับการเผยแพร่ไปยังเว็บไซต์อื่นมีการทำซ้ำบางส่วนหรือทั้งหมดในโดเมนเหล่านั้น เช่น
    https://news.example.com/green-dresses-for-every-day-155672.html (โพสต์ที่เผยแพร่) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (โพสต์ต้นฉบับ)

เหตุผลที่ใช้ในการเลือก Canonical URL

มีเหตุผลหลายประการที่ควรเลือกหน้า Canonical อย่างชัดแจ้งในหน้าที่ซ้ำกันหรือคล้ายกันหลายหน้า ดังนี้

  • เพื่อระบุ URL ที่ต้องการให้ผู้ใช้เห็นในผลการค้นหา คุณอาจต้องการให้ผู้ใช้เข้าถึงหน้าผลิตภัณฑ์ชุดกระโปรงสีเขียวผ่าน https://www.example.com/dresses/green/greendress.html ไม่ใช่ https://example.com/dresses/cocktail?gclid=ABCD
  • เพื่อรวมสัญญาณลิงก์ของหน้าที่คล้ายกันหรือซ้ำกัน ซึ่งจะช่วยให้เครื่องมือค้นหารวมข้อมูลของ URL (เช่น ลิงก์ที่เชื่อมไปยังเนื้อหา) แต่ละรายการไว้ใน URL เดียวที่ต้องการได้ นั่นหมายความว่าลิงก์จากเว็บไซต์อื่นที่ชี้ไปยัง http://example.com/dresses/cocktail?gclid=ABCD จะรวมเข้ากับลิงก์ไปยัง https://www.example.com/dresses/green/greendress.html
  • เพื่อลดความซับซ้อนของเมตริกการติดตามสำหรับผลิตภัณฑ์หรือหัวข้อเดียว URL ที่หลากหลายทำให้การรวมเมตริกสำหรับเนื้อหาเฉพาะเจาะจงเป็นเรื่องท้าทายมากขึ้น
  • เพื่อจัดการเนื้อหาที่คัดลอกมา หากคัดลอกเนื้อหาของตนเองเพื่อเผยแพร่ในโดเมนอื่นๆ คุณอาจต้องการดูให้แน่ใจว่า URL ดังกล่าวจะปรากฏในผลการค้นหา
  • เพื่อหลีกเลี่ยงการใช้เวลาในการรวบรวมข้อมูลจากหน้าที่ซ้ำกัน คุณต้องการให้ Googlebot ใช้ประโยชน์สูงสุดจากเว็บไซต์ จึงควรให้ Googlebot ใช้เวลาในการรวบรวมข้อมูลหน้าเว็บใหม่ (หรือหน้าที่อัปเดต) ในเว็บไซต์มากกว่าที่จะรวบรวมข้อมูลหน้าเว็บเดียวกันในรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่

ดูว่า Google พิจารณาว่าหน้าใดเป็นหน้า Canonical

ใช้เครื่องมือตรวจสอบ URL เพื่อดูว่า Google พิจารณาว่าหน้าใดเป็นหน้า Canonical

ระบุหน้า Canonical

หากต้องการระบุ Canonical URL สำหรับ URL ที่ซ้ำกันหรือหน้าที่คล้ายกัน ให้เลือกวิธีใดวิธีหนึ่งต่อไปนี้ อย่าลืมปฏิบัติตามหลักเกณฑ์ทั่วไป

วิธีและคำอธิบาย
แท็ก rel=canonical <link>

เพิ่มแท็ก <link> ในโค้ดสำหรับหน้าที่ซ้ำกันทั้งหมดที่ชี้ไปยังหน้า Canonical

ข้อดี:
  • แมปหน้าที่ซ้ำกันได้ไม่จำกัดจำนวน

ข้อเสีย:

  • ขนาดของหน้าเว็บอาจเพิ่มขึ้น
  • การรักษาการแมปในเว็บไซต์ขนาดใหญ่หรือเว็บไซต์ที่มีการเปลี่ยนแปลง URL บ่อยๆ อาจซับซ้อน
  • ใช้งานได้เฉพาะกับหน้า HTML ไม่ใช่สำหรับไฟล์ เช่น PDF ในกรณีเช่นนี้คุณใช้ส่วนหัว HTTP ของ rel=canonical ได้
ส่วนหัว HTTP ของ rel=canonical

ส่งส่วนหัว rel=canonical ในการตอบกลับของหน้าเว็บ

ข้อดี:

  • ขนาดหน้าไม่เพิ่มขึ้น
  • แมปหน้าที่ซ้ำกันได้ไม่จำกัดจำนวน

ข้อเสีย:

  • การรักษาการแมปในเว็บไซต์ขนาดใหญ่หรือเว็บไซต์ที่มีการเปลี่ยนแปลง URL บ่อยๆ อาจซับซ้อน
แผนผังเว็บไซต์

ระบุหน้า Canonical ในแผนผังเว็บไซต์

ข้อดี:

  • ดำเนินการและบำรุงรักษาได้ง่ายโดยเฉพาะอย่างยิ่งในเว็บไซต์ขนาดใหญ่

ข้อเสีย:

  • Googlebot ยังคงต้องระบุหน้าเว็บที่ซ้ำกันที่เกี่ยวข้องสำหรับหน้า Canonical ใดก็ตามที่คุณประกาศในแผนผังเว็บไซต์
  • สัญญาณที่ส่งไปยัง Googlebot มีความสำคัญน้อยกว่าเทคนิคการแมปแบบ rel=canonical
การเปลี่ยนเส้นทาง 301 ใช้การเปลี่ยนเส้นทาง 301 เพื่อแจ้งให้ Googlebot ทราบว่า URL เปลี่ยนเส้นทางเป็นเวอร์ชันที่ดีกว่า URL ที่ระบุ ใช้ตัวเลือกนี้เฉพาะเมื่อเลิกใช้หน้าที่ซ้ำ
รูปแบบ AMP หากมีตัวแปรที่เป็นหน้า AMP ให้ทำตามหลักเกณฑ์ AMP เพื่อระบุหน้า Canonical และรูปแบบ AMP

หลักเกณฑ์ทั่วไป

สำหรับวิธีกำหนดหน้า Canonical ทั้งหมด ให้ทำตามหลักเกณฑ์ทั่วไปเหล่านี้

  • อย่าใช้ไฟล์ robots.txt ในการกำหนดหน้า Canonical
  • อย่าใช้เครื่องมือนำ URL ออกเพื่อจุดประสงค์ในการกำหนดหน้า Canonical เพราะจะเป็นการนำ URL ทุกเวอร์ชันออกจากการค้นหาของ Search
  • อย่าระบุ URL ที่ต่างกันเป็น Canonical สำหรับหน้าเว็บเดียวกันโดยใช้เทคนิคการกำหนดหน้า Canonical ที่ต่างกันหรือเหมือนกัน (เช่น อย่าระบุ URL หนึ่งในแผนผังเว็บไซต์ แต่ระบุ URL อื่นสำหรับหน้าเดียวกันนั้นโดยใช้ rel="canonical"
  • อย่าใช้ noindex เป็นวิธีป้องกันการเลือกหน้า Canonical คำสั่งนี้มีจุดประสงค์เพื่อยกเว้นหน้าจากดัชนี ไม่ใช่เพื่อจัดการกับตัวเลือกของหน้า Canonical
  • ระบุหน้า Canonical เมื่อใช้แท็ก hreflang ระบุหน้า Canonical ที่ใช้ภาษาเดียวกัน หรือใช้ภาษาทดแทนที่ดีที่สุดหากไม่มีหน้า Canonical สำหรับภาษาเดียวกันนั้น

  • เมื่อทำการลิงก์ภายในเว็บไซต์ ให้ลิงก์ไปยัง Canonical URL แทนการลิงก์ไปยัง URL ของหน้าที่ซ้ำกัน การลิงก์ไปยัง URL ที่คุณเลือกให้เป็นหน้า Canonical อย่างสอดคล้องกันช่วยให้ Google เข้าใจสิ่งที่คุณต้องการ

ใช้ HTTPS กับ Canonical URL แทนที่จะใช้ HTTP

Google จะเลือกหน้า HTTPS เป็นหน้า Canonical แทนที่จะเลือกหน้า HTTP ที่เทียบเท่ากัน ยกเว้นในกรณีที่มีปัญหาหรือสัญญาณที่บอกถึงความขัดแย้งกัน เช่น

  • หน้า HTTPS มีใบรับรอง SSL ที่ไม่ถูกต้อง
  • หน้า HTTPS มีการขึ้นต่อกันที่ไม่ปลอดภัย (นอกเหนือจากภาพ)
  • หน้า HTTPS เปลี่ยนเส้นทางผู้ใช้ไปยังหรือผ่านหน้า HTTP
  • หน้า HTTPS มีลิงก์ rel="canonical" ไปยังหน้า HTTP

แม้ว่าโดยค่าเริ่มต้น ระบบของเราจะเลือกใช้หน้า HTTPS แทนหน้า HTTP แต่จะดำเนินการต่อไปนี้เพื่อให้มั่นใจว่าเราจะเลือกใช้ HTTPS ก็ได้

  • เพิ่มการเปลี่ยนเส้นทางจากหน้า HTTP ไปยังหน้า HTTPS
  • เพิ่มลิงก์ rel="canonical" จากหน้า HTTP ไปยังหน้า HTTPS
  • ใช้ HSTS

หากต้องการป้องกันไม่ให้ Google ทำให้หน้า HTTP เป็นหน้า Canonical อย่างไม่ถูกต้อง ให้หลีกเลี่ยงการปฏิบัติดังต่อไปนี้

  • หลีกเลี่ยงการใช้ใบรับรอง TLS/SSL ที่ไม่ถูกต้องและการเปลี่ยนเส้นทาง HTTPS ไปยัง HTTP เนื่องจากจะส่งผลให้ Google เลือก HTTP เป็นหน้า Canonical ได้อย่างไม่ถูกต้อง และการนำ HSTS มาใช้ก็จะไม่ช่วยลบล้างค่ากำหนดดังกล่าว
  • หลีกเลี่ยงการรวมหน้า HTTP ไว้ในแผนผังเว็บไซต์หรือรายการ hreflang แทนที่จะรวมเวอร์ชัน HTTPS
  • หลีกเลี่ยงการใช้ใบรับรอง SSL/TLS กับรูปแบบโฮสต์ที่ไม่ตรงกัน เช่น example.com แสดงใบรับรองของ www.example.com ใบรับรองนี้ต้องระบุข้อมูลตรงกับ URL เว็บไซต์ที่สมบูรณ์ของคุณ หรือเป็นใบรับรองแบบไวลด์การ์ดที่ใช้กับโดเมนย่อยหลายรายการในโดเมนได้

ผู้ใช้ขั้นสูงเท่านั้น: บอก Google ให้ข้ามพารามิเตอร์แบบไดนามิก

ใช้การจัดการพารามิเตอร์เพื่อบอก Googlebot เกี่ยวกับพารามิเตอร์ทั้งหมดที่ควรข้ามเมื่อรวบรวมข้อมูล การข้ามพารามิเตอร์บางตัวจะช่วยลดเนื้อหาที่ซ้ำกันในดัชนีของ Google และทำให้รวบรวมข้อมูลในเว็บไซต์ได้ดีขึ้น ตัวอย่างเช่น หากคุณระบุว่าให้ข้ามพารามิเตอร์ sessionid Googlebot จะถือว่า URL 2 รายการต่อไปนี้ซ้ำกัน

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

หากต้องการระบุว่าหน้าใดซ้ำกับหน้าอื่น คุณอาจใช้แท็ก <link> ในส่วน head ของ HTML ได้

สมมติว่าคุณต้องการให้ https://example.com/dresses/green-dresses เป็น Canonical URL แม้ว่าจะมี URL หลายรายการที่เข้าถึงเนื้อหานี้ได้ก็ตาม ให้ระบุ URL นี้เป็น Canonical ตามขั้นตอนต่อไปนี้

  1. ทำเครื่องหมายหน้าเว็บที่ซ้ำกันทั้งหมดด้วยเอลิเมนต์ของลิงก์ rel="canonical"

    เพิ่มเอลิเมนต์ <link> ที่มีแอตทริบิวต์ rel="canonical" ลงในส่วน <head> ของหน้าที่ซ้ำกันซึ่งชี้ไปยังหน้า Canonical เช่น

    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
  2. หากหน้า Canonical มีรุ่นอุปกรณ์เคลื่อนที่ ให้เพิ่มลิงก์ rel="alternate" ไปยังหน้ารุ่นอุปกรณ์เคลื่อนที่ ดังนี้
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">
  3. เพิ่ม hreflang หรือการเปลี่ยนเส้นทางอื่นๆ ที่เหมาะสําหรับหน้านั้น

ใช้ส่วนหัว HTTP ของ rel="canonical"

หากกำหนดค่าเซิร์ฟเวอร์ได้ คุณสามารถใช้ส่วนหัว HTTP ของ rel="canonical" (แทนที่จะใช้แท็ก HTML) เพื่อระบุ Canonical URL สำหรับเอกสารที่ Search รองรับ รวมถึงเอกสารที่ไม่ใช่ HTML เช่น ไฟล์ PDF

หากคุณแสดงไฟล์ PDF ไฟล์หนึ่งใน URL หลายรายการ คุณสามารถส่งส่วนหัว HTTP ของ rel="canonical" เพื่อแจ้ง Googlebot ว่า URL ใดคือ Canonical URL สำหรับไฟล์ PDF ดังกล่าว

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

ขณะนี้ Google รองรับวิธีการนี้สำหรับผลการค้นหาเว็บเท่านั้น

ใช้แผนผังเว็บไซต์

เลือก Canonical URL สำหรับหน้าเว็บแต่ละหน้า และส่ง URL เหล่านั้นผ่านแผนผังเว็บไซต์ ระบบจะมองว่าหน้าเว็บทั้งหมดที่ระบุในแผนผังเว็บไซต์เป็นหน้า Canonical และ Googlebot จะเป็นผู้ตัดสินว่าหน้าเว็บใดซ้ำกัน (ถ้ามี) โดยพิจารณาจากความคล้ายคลึงกันของเนื้อหา

เราไม่รับประกันว่าจะถือว่า URL ในแผนผังเว็บไซต์เป็น Canonical URL แต่มองเป็นวิธีที่ง่ายในการกำหนด Canonical URL สำหรับเว็บไซต์ขนาดใหญ่ และแผนผังเว็บไซต์ก็เป็นวิธีที่มีประโยชน์ในการแจ้งให้ Google ทราบถึงหน้าเว็บที่คุณมองว่าสำคัญที่สุดในเว็บไซต์ของคุณ

อย่ารวมหน้าที่ไม่ใช่หน้า Canonical ไว้ในแผนผังเว็บไซต์ หากคุณจะใช้แผนผังเว็บไซต์ ให้ระบุเฉพาะ Canonical URL ในแผนผัง

ใช้การเปลี่ยนเส้นทาง 301 สำหรับ URL ที่เลิกใช้แล้ว

ใช้วิธีการนี้เมื่อคุณต้องการกำจัดหน้าเว็บซ้ำที่มีอยู่ แต่ควรตรวจสอบว่าการเปลี่ยนผ่านไปยัง URL ใหม่ใช้ได้ก่อนที่จะเลิกใช้ URL เก่า

สมมติว่าสามารถเข้าถึงหน้าของคุณได้หลายวิธี

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

ให้เลือก URL เหล่านั้นรายการใดรายการหนึ่งเป็น Canonical URL และใช้การเปลี่ยนเส้นทาง 301 เพื่อส่งการเข้าชมจาก URL อื่นๆ ไปยัง URL ที่คุณต้องการ การเปลี่ยนเส้นทาง 301 ทางฝั่งเซิร์ฟเวอร์คือวิธีที่ดีสุดที่ช่วยให้แน่ใจว่ามีการเปลี่ยนเส้นทางผู้ใช้และเครื่องมือค้นหาไปยังหน้าที่ถูกต้อง รหัสสถานะ 301 หมายถึงหน้าเว็บได้ย้ายไปยังตำแหน่งที่ตั้งใหม่เป็นการถาวร

ถ้าคุณใช้บริการโฮสต์เว็บไซต์ ให้ค้นหาเอกสารประกอบการตั้งค่าการเปลี่ยนเส้นทาง 301 ของบริการดังกล่าว

การแก้ปัญหา

หาก Canonical URL อยู่ในพร็อพเพอร์ตี้ที่คุณไม่ได้เป็นเจ้าของ คุณจะไม่เห็นปริมาณการเข้าชมสำหรับหน้าเว็บที่ซ้ำกัน เหตุผลทั่วไปที่ทำให้ Canonical URL อาจอยู่ในพร็อพเพอร์ตี้แยกกันมีดังนี้

  • รูปแบบภาษาที่ทำเครื่องหมายไว้ไม่ถูกต้อง: หากคุณมีหลายเว็บไซต์ที่มีเนื้อหาโดยส่วนใหญ่เหมือนกันโดยแปลเป็นภาษาต่างๆ สำหรับผู้ใช้ทั่วโลก โปรดตรวจสอบว่าคุณปฏิบัติตามหลักเกณฑ์สำหรับเว็บไซต์ที่แปลเป็นภาษาท้องถิ่น
  • แท็ก Canonical ที่ไม่ถูกต้อง: ระบบจัดการเนื้อหา (CMS) บางระบบหรือปลั๊กอิน CMS อาจใช้เทคนิคการกำหนดหน้า Canonical เพื่อชี้ไปยัง URL ในเว็บไซต์ภายนอกอย่างไม่ถูกต้อง ตรวจสอบเนื้อหาของคุณเพื่อดูว่าเป็นกรณีนี้หรือไม่ หากเว็บไซต์แสดงให้เห็นการเลือก Canonical URL ที่ไม่ตรงกับที่คุณคาดไว้ ก็อาจเป็นเพราะการใช้ rel="canonical" หรือการเปลี่ยนเส้นทาง 301 อย่างไม่ถูกต้อง ให้แก้ไขปัญหานั้นโดยตรง
  • เซิร์ฟเวอร์ที่กำหนดค่าผิดพลาด: การกำหนดค่าโฮสติ้งบางอย่างที่ไม่ถูกต้องอาจเป็นสาเหตุให้เกิดการเลือก URL ข้ามโดเมนที่ไม่ตรงกับที่คาดไว้ เช่น
    • เซิร์ฟเวอร์อาจมีการกำหนดค่าผิดพลาดให้แสดงเนื้อหาจาก a.com เพื่อตอบสนองต่อคำขอ URL ใน b.com
    • เว็บเซิร์ฟเวอร์ 2 รายการที่ไม่เกี่ยวข้องกันอาจจะแสดงผลหน้า Soft 404 ที่เหมือนกันซึ่ง Google ระบุไม่ได้ว่าเป็นหน้าข้อผิดพลาด
  • การแฮ็กที่ประสงค์ร้าย: การโจมตีเว็บไซต์บางครั้งทำให้เกิดโค้ดที่แสดงการเปลี่ยนเส้นทาง 301 ของ HTTP หรือแทรกเอลิเมนต์ของลิงก์ rel="canonical" แบบข้ามโดเมนเข้าไปใน <head> แบบ HTML หรือส่วนหัว HTTP ซึ่งโดยปกติจะชี้ไปยัง URL ที่โฮสต์เนื้อหาที่ประสงค์ร้ายหรือเป็นสแปม ในกรณีเหล่านี้ อัลกอริทึมของเราอาจเลือก URL ที่ประสงค์ร้ายหรือที่เป็นสแปมแทนที่จะเป็น URL ในเว็บไซต์ที่ถูกบุกรุก
  • เว็บไซต์เลียนแบบ: ในบางสถานการณ์ซึ่งพบได้น้อย อัลกอริทึมของเราอาจเลือก URL จากเว็บไซต์ภายนอกที่โฮสต์เนื้อหาโดยไม่ได้รับอนุญาตจากคุณ หากเชื่อว่าเว็บไซต์อื่นกำลังทำซ้ำเนื้อหาของคุณซึ่งเป็นการละเมิดกฎหมายลิขสิทธิ์ คุณสามารถติดต่อโฮสต์ของเว็บไซต์เพื่อขอให้นำเนื้อหาออก นอกจากนี้ คุณขอให้ Google นำหน้าที่ละเมิดออกจากผลการค้นหาได้โดยยื่นคำขอภายใต้ Digital Millennium Copyright Act