Praktik terbaik struktur URL untuk Google

Google mendukung URL seperti yang ditetapkan oleh RFC 3986. Karakter yang ditetapkan memiliki fungsi khusus oleh standar tersebut harus berenkode persen. Karakter ASCII tanpa fungsi khusus mungkin dibiarkan dalam bentuk yang tidak dienkode. Selain itu, karakter dalam rentang non-ASCII harus berenkode UTF-8.

Jika memungkinkan, gunakan kata yang dapat dibaca daripada nomor ID yang panjang di URL Anda.

Direkomendasikan: Kata yang sederhana dan deskriptif di URL:

https://en.wikipedia.org/wiki/Aviation

Direkomendasikan: Kata yang dilokalkan di URL, jika berlaku.

https://www.example.com/lebensmittel/pfefferminz

Direkomendasikan: Gunakan encoding UTF-8 jika diperlukan. Misalnya, contoh berikut menggunakan encoding UTF-8 untuk karakter Arab di URL:

https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9

Contoh berikut menggunakan encoding UTF-8 untuk karakter Mandarin di URL:

https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7

Contoh berikut menggunakan encoding UTF-8 untuk umlaut di URL:

https://www.example.com/gem%C3%BCse

Contoh berikut menggunakan encoding UTF-8 untuk emoji di URL:

https://example.com/%F0%9F%A6%99%E2%9C%A8

Tidak direkomendasikan: Menggunakan karakter non-ASCII di URL:

https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨

Tidak direkomendasikan: Nomor ID yang panjang dan tidak dapat dibaca di URL:

https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Jangan gunakan fragmen untuk mengubah konten halaman, karena Google biasanya tidak mendukung URL fragmen. Jika Anda menggunakan JavaScript untuk mengubah konten, gunakan History API sebagai gantinya.

Tidak direkomendasikan: URL fragmen:

https://example.com/#/potatoes

Jika situs Anda bersifat multiregional, sebaiknya gunakan struktur URL yang mempermudah penargetan-geo ke situs Anda. Untuk contoh lainnya terkait cara membuat struktur URL, lihat menggunakan URL khusus lokalitas.

Direkomendasikan: Domain khusus negara:

https://example.de

Direkomendasikan: Subdirektori khusus negara dengan gTLD:

https://example.com/de/

Pertimbangkan penggunaan tanda hubung untuk memisahkan kata-kata di URL Anda karena akan mempermudah pengguna dan mesin telusur dalam mengidentifikasi konsep di URL. Sebaiknya gunakan tanda hubung (-), bukan garis bawah (_) di URL Anda.

Direkomendasikan: Tanda hubung (-):

https://www.example.com/summer-clothing/filter?color-profile=dark-grey

Tidak direkomendasikan: Garis bawah (_):

https://www.example.com/summer_clothing/filter?color_profile=dark_grey

Tidak direkomendasikan: Kata di URL digabung:

https://www.example.com/greendress

Masalah umum terkait URL

URL yang terlalu rumit, khususnya yang berisi beberapa parameter, dapat menyebabkan masalah bagi crawler dengan membuat banyak URL tidak penting yang mengarah ke konten identik atau mirip di situs Anda. Akibatnya, Googlebot mungkin memakai lebih banyak bandwidth dari yang semestinya, atau mungkin tidak dapat mengindeks semua konten di situs Anda secara lengkap.

Sejumlah besar URL yang tidak penting dapat diakibatkan oleh beberapa masalah. Di antaranya meliputi:

  • Pemfilteran tambahan atas kumpulan item. Banyak situs memberikan tampilan yang berbeda terkait kumpulan item atau hasil penelusuran yang sama, yang sering kali memungkinkan pengguna memfilter kumpulan ini dengan menggunakan kriteria yang ditentukan (misalnya: tunjukkan hotel di pantai kepada saya). Saat filter dapat dikombinasikan melalui penambahan (misalnya: hotel di pantai dan dengan pusat kebugaran), jumlah URL (tampilan data) di situs akan meluap. Membuat daftar hotel yang sedikit berbeda dalam jumlah besar adalah hal yang berlebihan karena Googlebot hanya perlu melihat sedikit daftar saja yang digunakan untuk menjangkau halaman untuk setiap hotel. Misalnya:
    • Properti hotel dengan "tingkat nilai":
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Properti hotel dengan "tingkat nilai" di pantai:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Properti hotel dengan "tingkat nilai" di pantai dan dilengkapi pusat kebugaran:
      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Pembuatan dokumen yang dinamis. Hal ini dapat menyebabkan perubahan kecil karena penghitung, stempel waktu, atau iklan.
  • Parameter bermasalah di URL. ID Sesi, misalnya, dapat menghasilkan duplikasi dalam jumlah yang sangat besar dan juga jumlah URL yang lebih besar.
  • Mengurutkan parameter. Beberapa situs belanja yang besar menyediakan beberapa cara untuk mengurutkan item yang sama, sehingga menghasilkan jumlah URL yang lebih besar. Misalnya:
    https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parameter yang tidak relevan dalam URL, misalnya parameter rujukan. Contoh:
    https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Masalah kalender. Kalender yang dibuat secara dinamis dapat menghasilkan link untuk tanggal pada masa mendatang dan tanggal yang telah lalu tanpa batasan tanggal awal atau akhir. Contoh:
    https://www.example.com/calendar.php?d=13&m=8&y=2011
  • Link relatif yang rusak. Link relatif yang rusak sering kali dapat mengakibatkan ruang yang tidak terhingga. Masalah ini kerap kali timbul akibat elemen jalur berulang. Contoh:
    https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Menyelesaikan masalah terkait URL

Untuk menghindari potensi masalah dengan struktur URL, kami menyarankan hal berikut:

  • Buat struktur URL yang sederhana. Pertimbangkan untuk mengelola konten Anda agar URL dapat disusun secara logis dan dengan cara yang paling dapat dipahami oleh pengguna.
  • Pertimbangkan menggunakan file robots.txt untuk memblokir akses Googlebot ke URL yang bermasalah. Secara khusus, pertimbangkan untuk memblokir URL dinamis, seperti URL yang membuat hasil penelusuran, atau URL yang dapat membuat ruang tak terbatas, seperti kalender. Menggunakan ekspresi reguler dalam file robots.txt dapat memungkinkan Anda memblokir banyak URL dengan mudah.
  • Jika memungkinkan, hindari penggunaan ID sesi dalam URL. Pertimbangkan menggunakan cookie sebagai gantinya.
  • Jika teks huruf besar dan kecil di URL diperlakukan sama oleh server web, konversikan semua teks ke format penulisan (huruf besar/kecil) yang sama sehingga Google lebih mudah memastikan bahwa URL merujuk ke halaman yang sama.
  • Jika memungkinkan, perpendek URL dengan memangkas parameter yang tidak dibutuhkan.
  • Jika situs Anda memiliki kalender yang tidak terhingga, tambahkan atribut nofollow untuk menghubungkan ke halaman kalender mendatang yang dibuat secara dinamis.
  • Periksa situs Anda untuk melihat adanya link relatif yang rusak.