หลีกเลี่ยงการสร้างเนื้อหาที่ซ้ำกัน

โดยทั่วไปเนื้อหาที่ซ้ำกันหมายถึงกลุ่มเนื้อหาที่สำคัญภายในหรือทั่วทั้งโดเมนซึ่งตรงกับเนื้อหาอื่นทุกประการหรือเห็นได้ว่าคล้ายคลึงกัน โดยส่วนใหญ่จะไม่ใช่การทำขึ้นเพื่อหลอกลวง ตัวอย่างของเนื้อหาที่ทำซ้ำที่ไม่ประสงค์ร้ายอาจรวมถึง

  • ฟอรัมสนทนาที่อาจสร้างหน้าเว็บทั้งแบบปกติและแบบตัดทอนรายละเอียดสำหรับอุปกรณ์เคลื่อนที่
  • สินค้าในร้านที่แสดงหรือลิงก์โดยใช้ URL ที่แตกต่างกันหลายรายการ
  • หน้าเว็บในเวอร์ชันสำหรับพิมพ์เท่านั้น

หากเว็บไซต์ของคุณมีหน้าเว็บหลายๆ หน้าที่มีเนื้อหาเหมือนกันเป็นส่วนใหญ่ คุณสามารถระบุ URL ที่ต้องการให้กับ Google ได้หลายวิธีด้วยกัน (เรียกว่า "การใช้รูปแบบบัญญัติ") ข้อมูลเพิ่มเติมเกี่ยวกับการกำหนดหน้า Canonical

อย่างไรก็ตาม ในบางกรณี เนื้อหาอาจถูกทำซ้ำทั่วทั้งโดเมนอย่างตั้งใจ เพื่อพยายามบิดเบือนการจัดอันดับของเครื่องมือค้นหาหรือให้ได้มาซึ่งอัตราการเข้าชมที่เพิ่มขึ้น การกระทำที่หลอกลวงเช่นนี้อาจทำให้ผู้ใช้มีประสบการณ์การใช้งานที่ไม่ดี เมื่อผู้เข้าชมพบเนื้อหาเดียวกันซ้ำๆ กันอยู่เรื่อยๆ ในผลการค้นหาชุดหนึ่ง

Google มุ่งมั่นที่จะจัดทำดัชนีและแสดงหน้าเว็บที่มีข้อมูลที่แตกต่างกันอย่างชัดเจน ตัวอย่างเช่น ตัวกรองนี้หมายถึง หากเว็บไซต์ของคุณมีบทความเวอร์ชัน "ปกติ" และ "สำหรับพิมพ์" และไม่มีการบล็อกเวอร์ชันใดๆ ด้วยเมตาแท็ก noindex เราจะเลือกเวอร์ชันใดเวอร์ชันหนึ่งมาแสดง ในกรณีที่ไม่ค่อยพบซึ่ง Google พิจารณาว่าเนื้อหาที่ซ้ำกันนั้นอาจแสดงขึ้นมาโดยมีเจตนาบิดเบือนการจัดอันดับของเราและหลอกลวงผู้ใช้ เราจะทำการแก้ไขที่เหมาะสมในการจัดทำดัชนีและการจัดอันดับเว็บไซต์ที่เกี่ยวข้องอีกด้วย ดังนั้น การจัดอันดับของเว็บไซต์นั้นอาจได้รับผลกระทบ หรือเราอาจนำเว็บไซต์ออกจากดัชนีของ Google ไปเลย ซึ่งในกรณีเช่นนี้เว็บไซต์นั้นจะไม่ปรากฏในผลการค้นหาอีกต่อไป

คุณสามารถดำเนินการตามขั้นตอนเพื่อเข้าจัดการกับปัญหาเนื้อหาที่ทำซ้ำ และตรวจดูว่าผู้เข้าชมจะพบเนื้อหาที่คุณต้องการให้เห็น

  • ใช้ 301: หากคุณจัดโครงสร้างเว็บไซต์ใหม่ ให้ใช้การเปลี่ยนเส้นทาง 301 ("RedirectPermanent") ในไฟล์ .htaccess เพื่อเปลี่ยนเส้นทางองผู้ใช้, Googlebot และสไปเดอร์อื่นๆ อย่างแยบยล (ใน Apache คุณสามารถดำเนินการได้ด้วยไฟล์ .htaccess ส่วนใน IIS คุณสามารถดำเนินการได้โดยใช้คอนโซลการดูแลระบบ)
  • ทำให้สอดคล้องกัน: พยายามทำให้การลิงก์ภายในสอดคล้องกัน เช่น อย่าลิงก์ไปยัง http://www.example.com/page/ และ http://www.example.com/page และ http://www.example.com/page/index.htm
  • ใช้โดเมนระดับบนสุด: หากเป็นไปได้ โปรดใช้โดเมนระดับบนสุดในการจัดการเนื้อหาที่เจาะจงประเทศ เราจะได้แสดงเอกสารในเวอร์ชันที่เหมาะสมที่สุดกับประเทศนั้นๆ ตัวอย่างเช่น เรามีแนวโน้มที่จะทราบว่า http://www.example.de มีเนื้อหาที่เน้นสำหรับประเทศเยอรมนีมากกว่า http://www.example.com/de หรือ http://de.example.com
  • เผยแพร่อย่างระมัดระวัง: หากคุณเผยแพร่เนื้อหาในเว็บไซต์อื่นๆ Google มักจะแสดงเวอร์ชันที่เราคิดว่าเหมาะสำหรับผู้ใช้มากที่สุดในการค้นหาแต่ละครั้ง ซึ่งอาจใช่หรือไม่ใช่เวอร์ชันที่คุณต้องการก็ได้ อย่างไรก็ตาม คุณควรตรวจสอบว่าเว็บไซต์แต่ละแห่งที่คุณเผยแพร่เนื้อหานั้นมีลิงก์กลับไปยังบทความต้นฉบับของคุณ และยังขอให้ผู้ที่ใช้เนื้อหาที่คุณเผยแพร่นั้นใช้เมตาแท็ก noindex เพื่อป้องกันไม่ให้เครื่องมือค้นหาจัดทำดัชนีเนื้อหาในเวอร์ชันของผู้ใช้เหล่านั้นได้อีกด้วย
  • ลดข้อความสำเร็จรูปที่ซ้ำกัน: เช่น แทนที่จะใส่ข้อความแสดงลิขสิทธิ์ที่ยาวๆ ไว้ท้ายหน้าทุกหน้า ให้ใส่ข้อความสรุปสั้นๆ แล้วลิงก์ไปยังหน้าที่มีรายละเอียดเพิ่มเติม นอกจากนี้คุณอาจใช้เครื่องมือจัดการพารามิเตอร์เพื่อกำหนดวิธีที่คุณต้องการให้ Google ปฏิบัติต่อพารามิเตอร์ของ URL
  • หลีกเลี่ยงการเผยแพร่ตัวยึดตำแหน่ง: ผู้ใช้ไม่ต้องการเห็นหน้า "ว่าง" ดังนั้นโปรดหลีกเลี่ยงตัวยึดตำแหน่งหากเป็นไปได้ ตัวอย่างเช่น อย่าเผยแพร่หน้าเว็บที่ยังไม่มีเนื้อหาจริงๆ อยู่ในหน้า หากคุณต้องการสร้างหน้าตัวยึดตำแหน่ง ให้ใช้เมตาแท็ก noindex เพื่อบล็อกไม่ให้มีการจัดทำดัชนีหน้าเหล่านี้
  • ทำความเข้าใจระบบจัดการเนื้อหาของคุณ: ตรวจสอบว่าคุณคุ้นเคยกับวิธีแสดงเนื้อหาบนเว็บไซต์ของคุณ บล็อก ฟอรัม และระบบที่เกี่ยวข้องมักแสดงเนื้อหาเดียวกันในรูปแบบต่างๆ เช่น รายการในบล็อกอาจปรากฏในหน้าแรกของบล็อก ในหน้าที่เก็บถาวร และในหน้ารายการอื่นๆ ที่มีป้ายกำกับเดียวกัน
  • ลดเนื้อหาที่คล้ายกัน: หากคุณมีหน้าที่คล้ายกันหลายหน้า ให้พิจารณาการเพิ่มเนื้อหาในแต่ละหน้าหรือรวมหน้าต่างๆ ไว้ในหน้าเดียว ตัวอย่างเช่น หากคุณมีเว็บไซต์ท่องเที่ยวที่มีหน้าเว็บแยกต่างหากสำหรับเมือง 2 เมือง แต่ทั้ง 2 หน้านั้นมีข้อมูลเดียวกัน คุณอาจรวมทั้ง 2 หน้าให้เป็นหน้าเดียวเกี่ยวกับทั้ง 2 เมือง หรือคุณอาจขยายแต่ละหน้าให้มีเนื้อหาที่แตกต่างกันเกี่ยวกับแต่ละเมือง

Google ไม่แนะนำให้บล็อกการเข้าถึงของโปรแกรมรวบรวมข้อมูลไปยังเนื้อหาที่ซ้ำกันบนเว็บไซต์ ไม่ว่าจะด้วยไฟล์ robots.txt หรือวิธีอื่นๆ หากเครื่องมือค้นหารวบรวมข้อมูลหน้าที่มีเนื้อหาที่ซ้ำกันไม่ได้ ก็จะไม่สามารถตรวจพบโดยอัตโนมัติว่า URL เหล่านี้ชี้ไปที่เนื้อหาเดียวกัน ดังนั้นจึงจะต้องถือว่าหน้าเหล่านั้นเป็นหน้าไม่ซ้ำที่แยกต่างหาก วิธีแก้ปัญหาที่ดีคืออนุญาตให้เครื่องมือค้นหารวบรวมข้อมูล URL ดังกล่าว แต่ทำเครื่องหมายว่าซ้ำกันโดยใช้เอลิเมนต์ของลิงก์ rel="canonical" ซึ่งเป็นเครื่องมือจัดการพารามิเตอร์ของ URL หรือการเปลี่ยนเส้นทาง 301 ในกรณีที่เนื้อหาที่ซ้ำกันทำให้เรารวบรวมข้อมูลเว็บไซต์มากเกินไป คุณยังปรับการตั้งค่าอัตราการรวบรวมข้อมูลใน Search Console ได้ด้วย

เนื้อหาที่ซ้ำกันในเว็บไซต์ไม่ใช่สาเหตุที่ทำให้เราดำเนินการกับเว็บไซต์นั้น เว้นแต่เราจะเห็นว่าเนื้อหาที่ซ้ำกันนั้นมีเจตนาหลอกลวงและบิดเบือนผลลัพธ์ของเครื่องมือค้นหา หากเว็บไซต์ได้รับผลกระทบจากปัญหาเนื้อหาที่ซ้ำกันและคุณไม่ดำเนินการตามคำแนะนำที่ระบุไว้ข้างต้น เราจะรับหน้าที่ในการเลือกเวอร์ชันของเนื้อหาที่จะแสดงในผลการค้นหาของเราให้เอง

อย่างไรก็ตาม หากตรวจสอบแล้วพบว่าคุณมีส่วนในการกระทำที่หลอกลวงและมีการนำเว็บไซต์ของคุณออกจากผลการค้นหาไปแล้ว โปรดตรวจสอบเว็บไซต์ของคุณอย่างรอบคอบ หากระบบได้นำเว็บไซต์ของคุณออกจากผลการค้นหา โปรดอ่านหลักเกณฑ์สำหรับผู้ดูแลเว็บสำหรับข้อมูลเพิ่มเติม เมื่อคุณเปลี่ยนแปลงแล้วและมั่นใจว่าเว็บไซต์ไม่ได้ละเมิดหลักเกณฑ์อีกต่อไป โปรดส่งเว็บไซต์เพื่อขอให้พิจารณาใหม่

ในบางสถานการณ์ซึ่งพบได้ไม่บ่อยนัก อัลกอริทึมของเราอาจเลือก URL จากเว็บไซต์ภายนอกที่โฮสต์เนื้อหาของคุณโดยไม่ได้รับอนุญาตจากคุณ หากคุณเชื่อว่าเว็บไซต์อื่นกำลังทำซ้ำเนื้อหาของคุณซึ่งเป็นการละเมิดกฎหมายลิขสิทธิ์ คุณสามารถติดต่อโฮสต์ของเว็บไซต์เพื่อขอให้นำออกได้ นอกจากนี้คุณสามารถขอให้ Google นำหน้าที่ละเมิดออกจากผลการค้นหาของเราโดยยื่นคำร้องภายใต้ Digital Millennium Copyright Act