Quản lý các trang web đa khu vực và đa ngôn ngữ

Nếu trang web của bạn có nội dung riêng cho người dùng theo từng ngôn ngữ, quốc gia hoặc khu vực, thì bạn có thể tối ưu hoá kết quả của Google Tìm kiếm cho trang web của mình.

Thông tin cơ bản:

  • Trang web đa ngôn ngữ là trang web cung cấp nội dung bằng nhiều ngôn ngữ. Ví dụ: trang web của một doanh nghiệp Canada có các phiên bản tiếng Anh và tiếng Pháp. Google Tìm kiếm sẽ cố gắng tìm các trang phù hợp với ngôn ngữ của người tìm kiếm.
  • Trang web đa khu vực là một trang web nhắm mục tiêu rõ ràng đến người dùng ở nhiều quốc gia. Ví dụ: một nhà sản xuất giao hàng đến cả Canada và Hoa Kỳ. Google Tìm kiếm sẽ cố gắng tìm trang địa phương phù hợp với người tìm kiếm.

Một số trang web cung cấp nội dung vừa theo khu vực vừa theo ngôn ngữ. Ví dụ: một trang web có thể có các phiên bản riêng cho Hoa Kỳ và Canada, trong đó, nội dung của phiên bản Canada lại có cả phiên bản tiếng Anh và tiếng Pháp.

Quản lý các phiên bản theo ngôn ngữ cho trang web

Nếu trang web của bạn có nội dung giống nhau bằng nhiều ngôn ngữ, sau đây là một số mẹo giúp người dùng (và Google Tìm kiếm) tìm đúng trang:

Dùng URL riêng cho từng phiên bản ngôn ngữ

Bạn nên dùng URL riêng cho mỗi phiên bản ngôn ngữ của một trang thay vì dùng cookie hoặc các chế độ cài đặt của trình duyệt để điều chỉnh ngôn ngữ cho nội dung trên trang.

Nếu bạn dùng URL riêng cho từng ngôn ngữ, hãy sử dụng thẻ chú thích hreflang để giúp các kết quả tìm kiếm trên Google liên kết đến đúng phiên bản ngôn ngữ phù hợp của trang.

Nếu bạn muốn linh động thay đổi nội dung hoặc chuyển hướng người dùng dựa trên chế độ cài đặt ngôn ngữ, hãy lưu ý rằng có thể Google sẽ không tìm và thu thập dữ liệu được tất cả phiên bản. Điều này là do trình thu thập dữ liệu Googlebot thường bắt nguồn từ Hoa Kỳ. Ngoài ra, trình thu thập dữ liệu này còn gửi các yêu cầu HTTP mà không thiết lập Accept-Language trong tiêu đề của yêu cầu.

Thông báo cho Google về các phiên bản ngôn ngữ

Google hỗ trợ một số phương pháp để gắn nhãn các phiên bản của một trang theo ngôn ngữ hoặc khu vực, bao gồm chú thích hreflang và sơ đồ trang web. Hãy đánh dấu trang của bạn sao cho phù hợp.

Đảm bảo rằng ngôn ngữ của trang rõ ràng

Google sử dụng nội dung xuất hiện trên trang của bạn để xác định ngôn ngữ của trang đó. Chúng tôi không dùng thông tin ngôn ngữ có trong mã lập trình, chẳng hạn như thuộc tính lang hoặc trong URL của trang. Bạn có thể giúp Google xác định đúng ngôn ngữ bằng cách dùng một ngôn ngữ duy nhất cho nội dung và phần điều hướng trên mỗi trang, cũng như tránh các bản dịch song ngữ.

Nếu bạn chỉ dịch phần văn bản lặp lại trên trang nhưng lại dùng một ngôn ngữ duy nhất cho phần lớn nội dung (thường xảy ra trên các trang có nội dung do người dùng tạo) thì bạn có thể tạo ra trải nghiệm không tốt cho người dùng, khi cùng một nội dung lại xuất hiện nhiều lần trong kết quả tìm kiếm với nhiều ngôn ngữ cho phần văn bản lặp lại.

Hãy dùng tệp robots.txt để ngăn công cụ tìm kiếm thu thập dữ liệu các trang được dịch tự động trên trang web của bạn. Bản dịch tự động không phải lúc nào cũng có nghĩa và có thể bị xem là nội dung vi phạm. Quan trọng hơn, một bản dịch kém chất lượng hay thiếu tự nhiên có thể khiến người dùng nhận định tiêu cực về trang web của bạn.

Cho phép người dùng chuyển đổi ngôn ngữ trên trang

Nếu một trang có nhiều phiên bản, hãy làm những điều sau:

  • Cân nhắc việc thêm siêu liên kết vào các phiên bản ngôn ngữ khác của trang. Như vậy, người dùng có thể nhấp để chọn phiên bản ngôn ngữ khác của trang.
  • Tránh chuyển hướng tự động dựa trên ngôn ngữ của người dùng mà hệ thống nhận thấy. Các lệnh chuyển hướng như vậy có thể khiến người dùng (và công cụ tìm kiếm) không xem được tất cả phiên bản của trang web.

Dùng URL riêng cho từng ngôn ngữ

Bạn có thể dùng từ ngữ đã bản địa hóa trong URL hoặc dùng một Tên miền quốc tế hóa (IDN). Tuy nhiên, đừng quên sử dụng phương thức mã hóa UTF-8 trong URL (thực tế là bạn nên sử dụng UTF-8 bất cứ khi nào có thể) và nhớ áp dụng ký tự thoát đúng cách khi liên kết đến các URL đó.

Nhắm mục tiêu nội dung trang web đến một quốc gia cụ thể (nhắm mục tiêu theo địa lý)

Bạn có thể nhắm mục tiêu trang web hoặc một số phần trên trang web đến người dùng ở một quốc gia cụ thể và nói một ngôn ngữ cụ thể. Điều này có thể cải thiện thứ hạng trang của bạn ở quốc gia mục tiêu, nhưng sẽ làm giảm thứ hạng trong kết quả ở các khu vực/ngôn ngữ khác.

Cách nhắm mục tiêu trang web theo địa lý trên Google:

  • Cấp trang hoặc cấp trang web: Dùng URL theo khu vực cho trang hoặc trang web.
  • Cấp trang: Dùng hreflang hoặc sơ đồ trang web để cho Google biết khu vực và ngôn ngữ áp dụng cho mỗi trang.
  • Cấp trang web: Nếu trang web của bạn có miền cấp cao nhất chung (ví dụ: .com, .org hoặc .eu), hãy chỉ định khu vực mục tiêu cho trang web bằng cách dùng báo cáo Nhắm mục tiêu quốc tế.

Hãy lưu ý rằng việc nhắm mục tiêu theo địa lý không mang tính chính xác tuyệt đối. Vì thế, bạn cần lường trước tình huống có người dùng truy cập vào "nhầm" phiên bản của trang web. Bạn có thể xử lý tình huống đó bằng cách hiển thị đường liên kết trên mọi trang để người dùng có thể tự chọn khu vực và/hoặc ngôn ngữ.

Dùng URL riêng cho từng khu vực

Hãy cân nhắc sử dụng một cấu trúc URL giúp bạn dễ dàng nhắm mục tiêu trang web hoặc một số phần trên trang web đến nhiều khu vực. Bảng sau đây mô tả các phương án cho bạn:

Phương án dùng cấu trúc URL
Miền theo quốc gia

example.de

Ưu điểm:

  • Nhắm mục tiêu rõ ràng theo địa lý
  • Không quan trọng vị trí máy chủ
  • Dễ dàng phân tách các trang web

Nhược điểm:

  • Đắt tiền (nguồn cung có thể hạn chế)
  • Đòi hỏi nhiều cơ sở hạ tầng hơn
  • Đôi khi có yêu cầu nghiêm ngặt đối với miền cấp cao nhất theo mã quốc gia (ccTLD)
Miền phụ với miền cấp cao nhất chung (gTLD)

de.example.com

Ưu điểm:

  • Dễ dàng thiết lập
  • Có thể nhắm mục tiêu theo địa lý trong Search Console
  • Cho phép có nhiều vị trí máy chủ
  • Dễ dàng phân tách các trang web

Nhược điểm:

  • Nếu chỉ nhìn vào URL, người dùng có thể không nhận ra ý định nhắm mục tiêu theo địa lý (ví dụ: "de" là chỉ ngôn ngữ hay quốc gia?)
Thư mục con với miền cấp cao nhất chung (gTLD)

example.com/de/

Ưu điểm:

  • Dễ dàng thiết lập
  • Có thể nhắm mục tiêu theo địa lý trong Search Console
  • Chi phí bảo trì thấp (cùng máy chủ)

Nhược điểm:

  • Nếu chỉ nhìn vào URL, người dùng có thể không nhận ra ý định nhắm mục tiêu theo địa lý
  • Một vị trí máy chủ
  • Khó phân tách các trang web
Tham số URL

site.com?loc=de

Không nên.

Nhược điểm:

  • Khó phân đoạn dựa trên URL
  • Nếu chỉ nhìn vào URL, người dùng có thể không nhận ra ý định nhắm mục tiêu theo địa lý
  • Không thể nhắm mục tiêu theo địa lý trong Search Console

Google xác định khu vực mục tiêu bằng cách nào?

Google sử dụng một số tín hiệu để xác định đối tượng mục tiêu phù hợp nhất cho một trang:

  • Khu vực mục tiêu được xác định bằng báo cáo Nhắm mục tiêu quốc tế của Search Console. Nếu có miền cấp cao nhất dùng chung (gTLD) và có nhà cung cấp dịch vụ lưu trữ ở một quốc gia khác, thì bạn nên sử dụng Search Console để cho chúng tôi biết trang web của bạn muốn được liên kết với quốc gia nào (nếu bạn muốn nhắm mục tiêu trang web theo địa lý).
  • Tên miền cấp cao nhất theo mã quốc gia (ccTLD). Các tên miền này được gắn với một quốc gia cụ thể (ví dụ như .de cho Đức, .cn cho Trung Quốc). Vì thế, đây là một tín hiệu rõ ràng để cả người dùng và công cụ tìm kiếm biết rằng trang web của bạn rõ ràng là dành cho một quốc gia cụ thể. (Một số quốc gia hạn chế những người có thể sử dụng ccTLD. Vì thế, bạn hãy nhớ tìm hiểu trước.) Chúng tôi cũng xem một số ccTLD ảo (chẳng hạn như .tv hay .me) là gTLD vì chúng tôi nhận thấy rằng người dùng và chủ sở hữu trang web thường xem các miền này là miền chung chứ không phải miền được nhắm mục tiêu theo quốc gia (chúng tôi không có danh sách đầy đủ các ccTLD mà chúng tôi xem là gTLD vì danh sách đó sẽ thay đổi theo thời gian). Xem danh sách Google liệt kê các gTLD.
  • Câu lệnh hreflang trong thẻ, tiêu đề hay sơ đồ trang web.
  • Vị trí máy chủ (thông qua địa chỉ IP của máy chủ). Vị trí máy chủ thường nằm gần người dùng và có thể là tín hiệu về đối tượng mục tiêu của trang web. Một số trang web sử dụng mạng phân phối nội dung (CDN) hoặc được lưu trữ tại một quốc gia có cơ sở hạ tầng máy chủ web tốt hơn. Vì thế, đây không phải là một tín hiệu chắc chắn.
  • Các tín hiệu khác. Để biết được đối tượng mục tiêu của trang web của bạn, Google có thể dùng các nguồn tín hiệu khác như địa chỉ địa phương và số điện thoại trên các trang, ngôn ngữ địa phương và đơn vị tiền tệ trong nội dung, đường liên kết qua các trang web địa phương khác và/hoặc Google Doanh nghiệp của tôi (nếu có).

Những việc Google không làm:

  • Google thu thập dữ liệu web từ nhiều vị trí trên khắp thế giới. Chúng tôi không tìm cách thay đổi nguồn của trình thu thập dữ liệu được dùng cho một trang web để tìm mọi phiên bản của một trang trên trang web đó. Do đó, hãy đảm bảo rằng bạn thông báo rõ ràng cho Google về mọi biến thể ngôn ngữ/khu vực mà trang web của bạn hiển thị bằng cách sử dụng một trong những phương thức nêu tại đây (chẳng hạn như các mục hreflang, ccTLD hoặc đường liên kết cụ thể).
  • Google bỏ qua thẻ meta vị trí (như geo.position hoặc distribution) hoặc thuộc tính HTML nhắm mục tiêu theo địa lý.

Xử lý các trang trùng lặp trong trường hợp trang web có nhiều khu vực/ngôn ngữ

Nếu trang web đa khu vực của bạn cung cấp nội dung tương tự hoặc nội dung trùng lặp bằng cùng một ngôn ngữ trên nhiều URL (ví dụ: nếu cả example.de/example.com/de/ đều hiển thị cùng nội dung bằng tiếng Đức), hãy ưu tiên một phiên bản và dùng phần tử rel="canonical" và thẻ hreflang để đảm bảo URL của phiên bản ngôn ngữ/khu vực phù hợp được phân phát đến người tìm kiếm.

Miền cấp cao nhất dùng chung

Miền cấp cao nhất dùng chung (gTLD) là các miền không liên quan đến vị trí cụ thể. Nếu trang web của bạn có một miền cấp cao nhất dùng chung, chẳng hạn như .com, .org hoặc một miền bất kỳ trong danh sách dưới đây, và trang web này muốn nhắm mục tiêu đến người dùng ở một vị trí địa lý cụ thể, thì bạn nên nêu rõ quốc gia mục tiêu bằng một trong những phương thức nêu trên.

Google coi những miền sau đây là những gTLD có thể nhắm mục tiêu theo địa lý trong Search Console:

  • Miền cấp cao nhất chung (gTLD): Trừ phi miền cấp cao nhất được đăng ký với ICANN dưới dạng miền cấp cao nhất theo mã quốc gia (ccTLD), thì Google sẽ coi mọi TLD phân giải thông qua vùng gốc DNS IANA là gTLD. Ví dụ:
    • .com
    • .org
    • .edu
    • .gov
    • và nhiều miền khác.
  • Miền cấp cao nhất chung theo khu vực: Mặc dù có liên quan đến một khu vực địa lý, nhưng những miền này thường được xem như miền cấp cao nhất chung (giống như .com hoặc .org):
    • .eu
    • .asia
  • Miền cấp cao nhất chung theo mã quốc gia (ccTLD): Google xem một số ccTLD (như .tv hay .me) là gTLD vì chúng tôi nhận thấy rằng người dùng và chủ sở hữu trang web thường xem những miền này là miền chung chứ không phải miền được nhắm mục tiêu theo quốc gia. Đây là danh sách những ccTLD như vậy (danh sách này có thể thay đổi).
    • .ad
    • .as
    • .bz
    • .cc
    • .cd
    • .co
    • .dj
    • .fm
    • .io
    • .la
    • .me
    • .ms
    • .nu
    • .sc
    • .sr
    • .su
    • .tv
    • .tk
    • .ws