2010년 3월 19일 금요일
다국어 웹사이트는 두 개 이상의 언어로 콘텐츠를 제공하는 웹사이트입니다. 다국어 웹사이트의 예로는 영어와 프랑스어 버전을 포함하는 캐나다 비즈니스 사이트 또는 스페인어와 포르투갈어로 제공되는 라틴 아메리카 축구에 관한 블로그를 들 수 있습니다.
일반적인 경우에 타겟층이 다양한 언어 사용자로 구성되어 있다면 다국어 웹사이트를 운용하는 것이 좋습니다. 라틴 아메리카 축구에 대한 블로그를 브라질 독자들에게 제공하려면 포르투갈어로만 게시해도 됩니다. 하지만 아르헨티나의 축구 팬들에게도 콘텐츠를 제공하려면 스페인어로 콘텐츠를 작성하는 것이 좋습니다.
Google 및 언어 인식
Google은 각 페이지의 기본 언어가 무엇인지 파악하려 노력합니다. 페이지당 하나의 언어만 사용하고 원본과 번역본을 나란히 표시하지 마세요. 이렇게 하면 Google에서 더욱 간편하게 언어를 인식할 수 있습니다. Google에서는 두 개 이상의 언어로 된 페이지를 인식할 수 있습니다. 그러나 헤더, 사이드바, 메뉴 등 페이지의 모든 요소에 동일한 언어를 사용하는 것이 좋습니다.
Google에서는 'lang' 속성, 문서 유형 정의(DTD) 등 코드 수준의 언어 정보를 전부 무시한다는 점을 기억하세요. 일부 웹 편집 프로그램은 이러한 속성을 자동으로 생성합니다. 따라서 이러한 속성들은 웹페이지의 언어를 파악할 때 신뢰하기 어렵습니다.
Google에 방문하여 자신이 사용하는 언어로 검색하는 사용자는 현지화된 검색결과가 표시될 것이라고 기대합니다. 바로 지금이 웹마스터가 등장할 차례입니다. 아래 도움말을 참고해 콘텐츠를 현지화할 때 검색결과에 표시하는 것이 좋습니다.
다국어 사이트 분석: URL 구조
다국어 웹사이트를 개발할 때 특별한 URL을 만들지 않아도 됩니다. 그렇지만 사용자가 URL을 훑어보면서 자신이 웹사이트의 어느 섹션에 있는지 파악하려 할 수도 있습니다.
예를 들어 https://example.ca/en/mountain-bikes.html
또는 https://en.example.ca/mountain-bikes.html
와 같은 URL을 보면 사이트의 영어 섹션에 있음을 알 수 있습니다. https://example.ca/fr/mountain-bikes.html
또는 https://fr.example.ca/mountain-bikes.html
URL은 동일한 페이지의 프랑스어 버전임을 나타냅니다. 이러한 URL 구조를 활용하면 다국어 콘텐츠의 색인을 분석하는 일도 더 간편해집니다.
영어가 아닌 글자가 포함된 URL을 만들려면 UTF-8 인코딩을 사용해야 합니다. 콘텐츠 내에서 UTF-8로 인코딩된 URL이 연결되는 경우 이 URL이 제대로 이스케이프 처리되어야 합니다. URL을 직접 이스케이프 처리해야 하나요? 이 작업을 대신해 주는 온라인 URL 인코더를 금방 찾을 수 있습니다. 예를 들어 https://example.ca/fr/mountain-bikes.html
이라는 URL을 영어에서 프랑스어로 번역하면 https://example.ca/fr/vélo-de-montagne.html
과 같이 표시됩니다. 이 URL에는 영어가 아닌 글자(é)가 포함되어 있으므로 페이지의 링크에 사용할 수 있도록 이스케이프(https://example.ca/fr/v%C3%A9lo-de-montagne.html
)되었습니다.
다국어 웹사이트 크롤링 및 색인 생성
자동으로 번역된 버전은 색인이 생성되지 않도록 하는 것이 좋습니다. 자동 번역은 가끔 이해하기 어려울 때도 있고, 스팸으로 간주될 수도 있습니다. 무엇보다도 다국어 웹사이트를 만든다는 것은 여러 언어로 가치 있는 콘텐츠를 제공함으로써 더 많은 잠재고객에게 다가가는 데 있습니다. 사용자가 자동 번역을 이해하지 못하거나 인위적이라고 느껴지면 이러한 종류의 콘텐츠를 정말로 제공하고 싶은 것인지 자문해 보아야 합니다.
현지화를 할 예정이라면 Googlebot이 사이트의 모든 언어 버전을 쉽게 크롤링할 수 있도록 하세요. 페이지별로 링크를 연결하는 것이 좋습니다. 다시 말해 서로 다른 언어로 동일한 콘텐츠를 제공하는 여러 페이지 사이에서 상호 연결되는 링크를 제공할 수 있습니다. 이 기능은 사용자에게도 매우 유용할 수 있습니다.
이전 예시를 다시 떠올려 볼까요. 프랑스어 화자가 https://example.ca/en/mountain-bikes.html
에 도착했다고 가정해 보겠습니다. 그러면 이제 클릭 한 번으로 https://example.ca/fr/vélo-de-montagne.html
로 이동하여 동일한 콘텐츠를 프랑스어로 볼 수 있습니다.
사이트의 모든 콘텐츠가 크롤링될 가능성을 높이려면 사용자가 인식하는 언어를 기반으로 하는 자동 리디렉션은 피하는 것이 좋습니다. 이러한 리디렉션은 사용자 및 검색엔진이 사이트의 모든 버전을 보지 못하게 합니다.
마지막으로 각 언어의 콘텐츠에 별도의 URL을 지정하고, 번역된 버전을 표시할 때 쿠키를 사용하지 마세요.
문자 인코딩 사용하기
Google은 HTTP 헤더, HTML 페이지 헤더, 콘텐츠에서 직접 문자 인코딩을 추출합니다. 콘텐츠와 헤더가 맞지 않는 등 정보가 서로 충돌하는 일이 없도록 경계하는 것 외에 문자 인코딩과 관련해 별도로 취해야 할 조치는 없습니다. Google에서는 다양한 문자 인코딩을 인식할 수 있습니다. 하지만 가능하면 웹사이트에 UTF-8을 사용하세요.
여러 언어를 사용하더라도 걱정 마세요
이제 다국어 웹사이트에 관한 필수 정보를 모두 확인했습니다. 우리는 사람인지라 여러 언어를 사용하면 혀가 꼬일 수도 있지만 웹사이트는 전혀 그렇지 않습니다.
자세한 내용은 다지역 사이트 관련 게시물을 참고하세요. 다음 게시물에서는 글로벌 웹사이트에서 발생할 수 있는 여러 가지 특별한 상황에 관해 자세히 알아보겠습니다. 그때까지 언제든지 도움말 포럼을 방문하여 토론에 참여하세요.