Arbeiten mit mehrsprachigen Websites

Freitag, 19. März 2010

Eine Website wird als mehrsprachig bezeichnet, wenn sie Content in mindestens zwei Sprachen anbietet. Beispiele für mehrsprachige Websites sind die eines kanadischen Unternehmens, das eine englische und eine französische Version anbietet, oder ein Blog über Fußball in Lateinamerika, der auf Spanisch und Portugiesisch verfügbar ist.

In der Regel ist eine mehrsprachige Website immer dann sinnvoll, wenn eure Zielgruppe verschiedene Sprachen spricht. Wenn ihr mit eurem Blog über Fußball in Lateinamerika brasilianische Leser erreichen wollt, entscheidet ihr euch vielleicht nur für eine portugiesische Version. Wenn ihr jedoch auch Fußballfans in Argentinien erreichen wollt, wäre eine spanische Version hilfreich.

Google und Spracherkennung

Google versucht, die Hauptsprachen eurer einzelnen Seiten zu ermitteln. Ihr könnt die Spracherkennung erleichtern, indem ihr euch für eine Sprache pro Seite entscheidet und nicht mehrere Übersetzungen nebeneinanderstellt. Google erkennt zwar, dass eine Seite mehrere Sprachen enthält, wir empfehlen jedoch, die gleiche Sprache für alle Elemente einer Seite zu verwenden: Überschriften, Seitenleisten, Menüs usw.

Beachtet, dass Google alle Sprachinformationen auf Codeebene ignoriert – von „lang“-Attributen bis hin zu Dokumenttypdefinitionen (DTD). Einige Web-Editoren erstellen diese Attribute automatisch, weshalb sie bei der Ermittlung der Sprache einer Webseite nicht sehr verlässlich sind.

Ein Google-Nutzer erwartet, dass bei einer Suche in seiner Sprache auch lokalisierte Suchergebnisse angezeigt werden. Und hier kommt ihr als Webmaster ins Spiel: Wenn ihre eure Website lokalisiert, könnt ihr dies mit einigen der folgenden Tipps in den Suchergebnissen sichtbar machen.

Die Anatomie einer mehrsprachigen Website: URL-Struktur

Ihr müsst für eine mehrsprachige Website keine speziellen URLs erstellen. Dennoch möchten eure Nutzer möglicherweise anhand der URL erkennen können, in welchem Bereich eurer Website sie sich gerade befinden. Die folgenden URLs zum Beispiel sind ein klares Indiz dafür, dass sich der Nutzer auf der englischsprachigen Version dieser Website befindet: https://example.ca/en/mountain-bikes.html oder https://en.example.ca/mountain-bikes.html. Im Vergleich dazu sehen die URLs der französischsprachigen Version so aus: https://example.ca/fr/mountain-bikes.html oder https://fr.example.ca/mountain-bikes.html. Zusätzlich könnt ihr mit dieser URL-Struktur den Index eures mehrsprachigen Contents einfacher analysieren.

Wenn ihr URLs nicht mit lateinischen Zeichen erstellen möchtet, verwendet die UTF-8-Codierung. Mit UTF-8 codierte URLs sollten ordnungsgemäß funktionieren, wenn Sie über euren Content verknüpft sind. Wenn ihr eure URLs manuell codieren müsst, könnt ihr dafür ganz einfach einen Online-URL-Codierer verwenden. Wenn ihr beispielsweise die folgende URL (https://example.ca/fr/mountain-bikes.html) vom Englischen ins Französische übersetzen möchtet, könnte das etwa so aussehen: https://example.ca/fr/vélo-de-montagne.html. Da diese URL ein Sonderzeichen (é) enthält, würde sie bei korrekter Codierung so aussehen und könnte in einem Link auf euren Webseiten verwendet werden: https://example.ca/fr/v%C3%A9lo-de-montagne.html.

Crawlen und Indexieren eurer mehrsprachigen Website

Wir empfehlen, automatische Übersetzungen nicht zu indexieren. Automatische Übersetzungen machen nicht immer Sinn und könnten als potenzieller Spam angesehen werden. Das Ziel einer mehrsprachigen Website besteht darin, durch die Bereitstellung von nützlichem Content in mehreren Sprachen ein größeres Publikum zu erreichen. Wenn eure Nutzer eine automatische Übersetzung nicht verstehen oder diese in ihren Augen künstlich erscheint, solltet ihr euch fragen, ob ihr wirklich diese Art von Content bereitstellen möchtet.

Wenn ihr eine Website lokalisiert, sollte der Googlebot alle Sprachversionen einfach crawlen können. Zieht eine Vernetzung der Seiten in Betracht. Das heißt, dass ihr Verknüpfungen zwischen Seiten herstellen könnt, die den gleichen Content in verschiedenen Sprachen anbieten. Dies kann auch für eure Nutzer sehr hilfreich sein. Nehmen wir unser vorheriges Beispiel noch einmal und nehmen an, dass ein französischsprachiger Nutzer, der jetzt noch auf https://example.ca/en/mountain-bikes.html landet, mit einem Klick zur Seite https://example.ca/fr/vélo-de-montagne.html wechseln kann, wo der gleiche Content in französischer Sprache angezeigt wird.

Um das Crawlen von Content eurer Website zu erleichtern, solltet ihr automatische Weiterleitungen auf der Basis der vom Nutzer gewählten Spracheinstellung vermeiden. Durch diese Weiterleitungen können Nutzer und Suchmaschinen eventuell nicht alle Versionen eurer Website aufrufen.

Und zuletzt solltet ihr den Content für jede Sprache einer separaten URL zuweisen. Verwendet keine Cookies, um die übersetzten Versionen anzuzeigen.

Arbeiten mit Zeichencodierung

Google extrahiert Zeichencodierungen direkt aus HTTP-Headern, HTML-Seitenheadern und Content. Bei der Zeichencodierung muss nicht viel beachtet werden. Ihr solltet jedoch nach widersprüchlichen Informationen Ausschau halten, etwa zwischen Content und Überschrift. Obwohl Google verschiedene Zeichencodierungen erkennen kann, empfehlen wir, falls möglich, die Verwendung von UTF-8 auf eurer Website.

Solltet ihr einen Knoten in der Zunge haben…

Jetzt, wo ihr das alles wisst, bekommt ihr vielleicht beim Sprechen der vielen Sprachen einen Knoten in die Zunge, aber das muss nicht auf eure Website zutreffen!

Weitere Informationen findet ihr in unserem Post zum Thema Websites für mehrere Regionen. Außerdem sprechen wir in unserem nächsten Post über besondere Situationen, die beim Arbeiten mit globalen Websites auftreten können. Bis dahin könnt ihr gerne im Hilfeforum vorbeischauen und euch an einer Diskussion beteiligen.