แนวทางปฏิบัติแนะนําเกี่ยวกับโครงสร้าง URL สําหรับ Google
Google รองรับ URL ที่กําหนดโดย RFC 3986 อักขระที่กำหนดโดยมาตรฐานเป็นสงวนไว้ต้องเข้ารหัสด้วยเครื่องหมายเปอร์เซ็นต์ ระบบอาจทิ้งอักขระ ASCII ที่ไม่ได้สงวนไว้ในรูปแบบที่ไม่เข้ารหัส นอกจากนี้ อักขระในช่วงที่ไม่ใช่ ASCII ควรเข้ารหัสแบบ UTF-8
หากเป็นไปได้ ให้ใช้คำที่อ่านได้ใน URL แทนที่จะเป็นตัวเลขรหัสยาวๆ
แนะนำ: คําง่ายๆ ที่สื่อความหมายใน URL เช่น
https://en.wikipedia.org/wiki/Aviation
แนะนำ: คําแปลใน URL หากมี
https://example.com/lebensmittel/pfefferminz
แนะนำ: ใช้การเข้ารหัส UTF-8 ตามที่จำเป็น ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอักขระภาษาอาหรับใน URL
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอักขระภาษาจีนใน URL
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอักขระ Umlaut ใน URL
https://example.com/gem%C3%BCse
ตัวอย่างต่อไปนี้ใช้การเข้ารหัส UTF-8 สำหรับอีโมจิใน URL
https://example.com/%F0%9F%A6%99%E2%9C%A8
ไม่แนะนำ: ใช้อักขระที่ไม่ใช่ ASCII ใน URL
https://example.com/نعناع
https://example.com/杂货/薄荷
https://example.com/gemüse
https://example.com/🦙✨
ไม่แนะนำ: ตัวเลขรหัสยาวๆ ที่อ่านไม่ได้ใน URL เช่น
https://example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
อย่าใช้ส่วนย่อยเพื่อเปลี่ยนเนื้อหาของหน้าเว็บ เนื่องจากโดยทั่วไป Google จะไม่รองรับส่วนย่อย URL หากคุณใช้ JavaScript เพื่อเปลี่ยนเนื้อหา ให้ใช้ History API แทน
ไม่แนะนำ: ส่วนย่อย URL
https://example.com/#/potatoes
หากเว็บไซต์เป็นแบบหลายภูมิภาค ให้พิจารณาใช้โครงสร้าง URL ที่ช่วยลดความยุ่งยากในการกำหนดเป้าหมายตามภูมิศาสตร์บนเว็บไซต์ ดูตัวอย่างเพิ่มเติมเกี่ยวกับวิธีจัดโครงสร้าง URL ได้ที่การใช้ URL ภาษาท้องถิ่น
แนะนำ: โดเมนเจาะจงประเทศ เช่น
https://example.de
แนะนำ: ไดเรกทอรีย่อยเจาะจงประเทศที่มี gTLD เช่น
https://example.com/de/
ลองใช้ขีดกลางเพื่อแยกคําใน URL เพราะช่วยให้ผู้ใช้และเครื่องมือค้นหาระบุแนวคิดใน URL ได้ง่ายขึ้น เราขอแนะนำให้ใช้ขีดกลางสั้น (-
) แทนขีดล่าง (_
) ใน URL
แนะนำ: ขีดกลาง (-
) เช่น
https://example.com/summer-clothing/filter?color-profile=dark-grey
ไม่แนะนำ: ขีดล่าง (_
) เช่น
https://example.com/summer_clothing/filter?color_profile=dark_grey
ไม่แนะนำ: คำใน URL ที่ต่อเข้าด้วยกัน เช่น
https://example.com/greendress
เมื่อระบุพารามิเตอร์ของ URL ให้ใช้การเข้ารหัสทั่วไปต่อไปนี้ เครื่องหมายเท่ากับ (=
) เพื่อคั่นคู่คีย์-ค่าและเพิ่มพารามิเตอร์อื่นๆ ด้วยเครื่องหมายแอมเพอร์แซนด์ (&
) หากต้องการแสดงค่าหลายรายการสำหรับคีย์เดียวกันภายในคู่คีย์-ค่า คุณสามารถใช้อักขระใดก็ได้ที่ไม่ขัดแย้งกับ IETF STD 66 เช่น เครื่องหมายคอมมา (,
)
แนะนํา: ใช้เครื่องหมายเท่ากับ (=
) เพื่อคั่นคู่คีย์-ค่า และใช้เครื่องหมายแอมเพอร์แซนด์ (&
) เพื่อใส่พารามิเตอร์เพิ่มเติม ดังนี้
https://example.com/category?category=dresses&sort=low-to-high&sid=789
แนะนํา: ใช้คอมมา (,
) เพื่อแสดงค่าหลายรายการสําหรับคีย์เดียวกัน เครื่องหมายเท่ากับ (=
) เพื่อคั่นคู่คีย์-ค่า และแอมเพอร์แซนด์ (&
) เพื่อใส่พารามิเตอร์เพิ่มเติม
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
ไม่แนะนํา: ใช้โคลอน (:
) เพื่อคั่นคู่คีย์-ค่าและวงเล็บ ([ ]
) เพื่อใส่พารามิเตอร์เพิ่มเติม
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
ไม่แนะนํา: ใช้คอมมาเดี่ยว (,
) เพื่อคั่นคู่คีย์-ค่า และใช้คอมมาคู่ (,,
) เพื่อใส่พารามิเตอร์เพิ่มเติม
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789
ปัญหาที่พบบ่อยเกี่ยวกับ URL
URL ที่ซับซ้อนเกินไป โดยเฉพาะ URL ที่มีพารามิเตอร์หลายตัว อาจทำให้เกิดปัญหาสำหรับโปรแกรมรวบรวมข้อมูลโดยสร้าง URL ซึ่งชี้ไปยังเนื้อหาที่เหมือนกันหรือคล้ายคลึงกันในเว็บไซต์ของคุณในจำนวนที่มากเกินจำเป็น ดังนั้น Googlebot อาจใช้แบนด์วิดท์เกินกว่าที่จำเป็นมาก หรืออาจจัดทำดัชนีเนื้อหาทั้งหมดในเว็บไซต์ได้ไม่สมบูรณ์
URL จำนวนมากที่ไม่มีความจำเป็นอาจเกิดจากปัญหาหลายประการด้วยกัน ซึ่งรวมถึงสิ่งต่อไปนี้
- การกรองชุดของรายการที่เพิ่มเข้ามา เว็บไซต์หลายแห่งแสดงมุมมองที่แตกต่างกันสำหรับชุดรายการหรือผลการค้นหาเดียวกัน ซึ่งมักจะให้ผู้ใช้กรองชุดรายการนี้โดยใช้เกณฑ์ที่กำหนดไว้ (ตัวอย่างเช่น แสดงชื่อโรงแรมริมชายหาด) เมื่อสามารถรวมตัวกรองเข้าด้วยกันได้โดยการเพิ่มตัวกรองเข้ามา (ตัวอย่างเช่น โรงแรมริมชายหาดและมีศูนย์ออกกำลังกาย) จำนวน URL (มุมมองของข้อมูล) ในเว็บไซต์ก็จะเพิ่มสูงขึ้น การสร้างรายชื่อโรงแรมที่แตกต่างกันเล็กน้อยเป็นจำนวนมากถือเป็นเรื่องที่ซ้ำซ้อน เนื่องจาก Googlebot ต้องการเห็นรายชื่อเพียงจำนวนเล็กน้อยที่ทำให้สามารถเข้าถึงหน้าเว็บของโรงแรมแต่ละแห่งได้ ตัวอย่างเช่น
- โรงแรม "ราคาพิเศษ":
https://example.com/hotel-search-results.jsp?Ne=292&N=461
- โรงแรม "ราคาพิเศษ" ริมชายหาด:
https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
- โรงแรม "ราคาพิเศษ" ริมชายหาดและมีศูนย์ออกกำลังกาย:
https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
- โรงแรม "ราคาพิเศษ":
- การสร้างเอกสารแบบไดนามิก ซึ่งอาจทำให้เกิดการเปลี่ยนแปลงเพียงเล็กน้อยเนื่องจากตัวนับ การประทับเวลา หรือโฆษณา
- พารามิเตอร์ที่มีปัญหาใน URL ตัวอย่างเช่น รหัสเซสชันอาจสร้าง URL ที่มีความซ้ำซ้อนกันและมีจำนวนมาก
-
พารามิเตอร์การจัดเรียง เว็บไซต์ช็อปปิ้งขนาดใหญ่บางแห่งมีวิธีจัดเรียงสินค้าที่เหมือนกันหลายวิธี ซึ่งทำให้มี URL จำนวนมากขึ้น เช่น
https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- พารามิเตอร์ที่ไม่เกี่ยวข้องใน URL เช่น พารามิเตอร์อ้างอิง ตัวอย่าง
https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- ปัญหาเกี่ยวกับปฏิทิน ปฏิทินที่สร้างแบบไดนามิกอาจสร้างลิงก์ไปยังวันที่ในอนาคตหรือวันที่ที่ผ่านมาแล้วโดยไม่มีข้อจำกัดสำหรับวันที่เริ่มต้นหรือวันสิ้นสุด ตัวอย่าง
https://example.com/calendar.php?d=13&m=8&y=2011
- ลิงก์แบบสัมพัทธ์ที่เสีย ลิงก์แบบสัมพัทธ์ที่เสียมักทำให้เกิดช่องว่างที่ไม่สิ้นสุด บ่อยครั้ง ปัญหานี้เกิดขึ้นเนื่องจากองค์ประกอบของเส้นทางที่ซ้ำกัน ตัวอย่าง
https://example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
แก้ปัญหาที่เกี่ยวข้องกับ URL
ในการหลีกเลี่ยงปัญหาที่อาจเกิดขึ้นกับโครงสร้าง URL เราขอแนะนำดังนี้
- สร้างโครงสร้าง URL แบบง่าย โปรดพิจารณาจัดระเบียบเนื้อหาเพื่อให้การสร้าง URL เป็นไปอย่างสมเหตุสมผลและมีลักษณะที่มนุษย์เข้าใจได้ง่ายที่สุด
- โปรดพิจารณาใช้ไฟล์ robots.txt เพื่อบล็อก Googlebot ไม่ให้เข้าถึง URL ที่มีปัญหา โดยทั่วไปแล้ว ให้พิจารณาการบล็อก URL ที่ทำให้เกิดผลการค้นหาหรือมีการเว้นวรรคโดยไม่จำกัด เช่น ปฏิทิน การใช้นิพจน์ทั่วไปในไฟล์ robots.txt จะช่วยให้บล็อก URL จำนวนมากได้ง่ายขึ้น
- หากเป็นไปได้ โปรดหลีกเลี่ยงการใช้รหัสเซสชันใน URL และพิจารณาใช้คุกกี้แทน
- หากเว็บเซิร์ฟเวอร์ถือว่าข้อความตัวพิมพ์ใหญ่และตัวพิมพ์เล็กใน URL เป็นข้อความเดียวกัน ให้แปลงข้อความทั้งหมดเป็นตัวพิมพ์แบบเดียวกันเพื่อให้ Google ระบุว่า URL เหล่านั้นอ้างอิงหน้าเดียวกันได้ง่ายขึ้น
- หากเป็นไปได้ โปรดทำให้ URL สั้นลงโดยตัดพารามิเตอร์ที่ไม่จำเป็นออก
-
หากเว็บไซต์มีปฏิทินที่ไม่จำกัด ให้เพิ่มแอตทริบิวต์
nofollow
ให้กับลิงก์ไปยังหน้าปฏิทินในอนาคตซึ่งสร้างแบบไดนามิก - ตรวจสอบเว็บไซต์เพื่อหาลิงก์แบบสัมพัทธ์ที่เสีย