Bekerja dengan situs multibahasa

Jumat, 19 Maret 2010

Situs multibahasa adalah situs yang menawarkan konten dalam beberapa bahasa. Contoh situs multibahasa dapat berupa situs bisnis Kanada dengan versi Inggris dan Prancis, atau blog tentang sepak bola Amerika Latin yang tersedia dalam bahasa Spanyol dan Portugis.

Biasanya, wajar jika Anda memiliki situs multibahasa jika target audiens Anda terdiri dari penutur berbagai bahasa. Jika blog Anda tentang sepak bola Amerika Latin ditujukan untuk menjangkau audiens Brasil, Anda dapat memilih untuk memublikasikannya hanya dalam bahasa Portugis. Namun, jika Anda juga ingin menjangkau penggemar sepak bola dari Argentina, sebaiknya Anda juga menyediakan konten tersebut dalam bahasa Spanyol.

Google dan pengenalan bahasa

Google akan mencoba menentukan bahasa utama setiap halaman Anda. Anda dapat membantu mempermudah pengenalan bahasa jika hanya menggunakan satu bahasa per halaman dan menghindari terjemahan secara berdampingan. Meskipun Google dapat mengenali halaman yang ditampilkan dalam beberapa bahasa, sebaiknya gunakan bahasa yang sama untuk semua elemen halaman: header, sidebar, menu, dll.

Perlu diingat bahwa Google mengabaikan semua informasi bahasa tingkat kode, mulai dari atribut "lang" hingga Definisi Jenis Dokumen/Document Type Definitions (DTD). Beberapa program pengeditan web membuat atribut ini secara otomatis, sehingga program ini kurang bisa diandalkan saat mencoba menentukan bahasa halaman web.

Seseorang yang membuka Google dan menelusuri dalam bahasanya berharap menemukan hasil penelusuran yang dilokalkan, dan peran Anda sebagai webmaster sangat dibutuhkan di sini: jika Anda berencana melokalkannya, buat halaman tersedia di hasil penelusuran dengan beberapa tips di bawah.

Anatomi situs multibahasa: Struktur URL

Tidak perlu membuat URL khusus saat mengembangkan situs multibahasa. Meskipun demikian, pengguna Anda mungkin ingin mengidentifikasi bagian yang sedang mereka buka di situs Anda dengan melihat URL-nya saja. Misalnya, URL berikut memberi tahu pengguna bahwa mereka sedang membuka bagian situs berbahasa Inggris: https://example.ca/en/mountain-bikes.html atau https://en.example.ca/mountain-bikes.html. Sedangkan URL berikut memberi tahu pengguna bahwa mereka sedang melihat halaman yang sama dalam bahasa Prancis: https://example.ca/fr/mountain-bikes.html atau https://fr.example.ca/mountain-bikes.html. Selain itu, struktur URL ini akan mempermudah Anda menganalisis pengindeksan konten multibahasa.

Jika Anda ingin membuat URL dengan karakter selain bahasa Inggris, pastikan untuk menggunakan encoding UTF-8. URL berenkode UTF-8 harus di-escape dengan benar saat ditautkan dari dalam konten Anda. Jika perlu meng-escape URL secara manual, Anda dapat dengan mudah menemukan encoder URL online yang akan membantu melakukan itu. Misalnya, jika saya ingin menerjemahkan URL berikut dari bahasa Inggris ke Prancis, https://example.ca/fr/mountain-bikes.html, URL-nya mungkin akan terlihat seperti ini: https://example.ca/fr/vélo-de-montagne.html. Karena URL ini berisi satu karakter non-Inggris (é), seperti inilah tampilannya setelah di-escape dengan benar untuk digunakan dalam link di halaman Anda: https://example.ca/fr/v%C3%A9lo-de-montagne.html.

Meng-crawl dan mengindeks situs multibahasa

Sebaiknya jangan izinkan terjemahan otomatis untuk diindeks. Terjemahan otomatis terkadang tidak masuk akal dan berpotensi dianggap sebagai spam. Terlebih lagi, tujuan membuat situs multibahasa adalah menjangkau audiens yang lebih besar dengan memberikan konten bermanfaat dalam beberapa bahasa. Jika pengguna tidak dapat memahami terjemahan otomatis atau jika terjemahan terasa kaku bagi mereka, tanyakan kepada diri sendiri apakah Anda benar-benar ingin menampilkan konten semacam ini kepada pengguna.

Jika berencana melokalkan situs Anda, pastikan semua versi bahasa situs Anda dapat di-crawl Googlebot dengan mudah. Pertimbangkan untuk menerapkan sistem cross-link di setiap halaman. Dengan kata lain, Anda dapat menyediakan link antarhalaman dengan konten yang sama dalam bahasa yang berbeda. Hal ini juga sangat membantu bagi pengguna Anda. Terkait contoh sebelumnya, misalkan ada penutur bahasa Prancis yang kebetulan membuka https://example.ca/en/mountain-bikes.html; sekarang, pengguna dapat membuka https://example.ca/fr/vélo-de-montagne.html dengan sekali klik untuk melihat konten yang sama dalam bahasa Prancis.

Agar semua konten situs Anda lebih mudah di-crawl, hindari pengalihan otomatis berdasarkan bahasa yang digunakan pengguna. Pengalihan ini dapat mencegah pengguna (dan mesin telusur) melihat semua versi situs Anda.

Dan yang tak kalah penting, pastikan konten untuk setiap bahasa berada di URL terpisah—jangan gunakan cookie untuk menampilkan versi yang diterjemahkan.

Bekerja dengan encoding karakter

Google mengekstrak langsung encoding karakter dari header HTTP, header halaman HTML, dan konten. Tidak banyak yang perlu dilakukan terkait encoding karakter, selain memantau jika ada informasi yang tidak cocok - misalnya, antara konten dan header. Meskipun Google dapat mengenali berbagai encoding karakter, sebaiknya gunakan UTF-8 di situs Anda jika memungkinkan.

Jika lidah Anda terkilir...

Setelah Anda mengetahui semua ini, lidah Anda bisa terkilir saat berbicara dalam banyak bahasa, tetapi situs Anda tidak harus mengalaminya.

Untuk informasi selengkapnya, baca postingan kami tentang situs multiregional dan nantikan postingan kami berikutnya, yang akan membahas situasi khusus yang mungkin muncul ketika bekerja dengan situs global. Sementara itu, jangan ragu untuk membuka Forum Bantuan dan bergabung dalam diskusi.