Montag, 24. Januar 2011
Hin und wieder bekommen wir die Frage gestellt, ob die Sichtbarkeit einer Website in den Suchergebnissen von Google negativ beeinflusst werden kann, wenn eine Site nicht erreichbar ist und der Googlebot vergeblich versucht diese zu crawlen. Manchmal sind Ausfallzeiten unvermeidlich: ein Webmaster könnte die Website vom Netz nehmen, um notwendige Wartungsarbeiten aufgrund rechtlicher oder kultureller Anforderungen durchzuführen. Geplante Ausfallzeiten, die nicht eindeutig als solche gekennzeichnet sind, können durchaus die Reputation einer Website negativ beeinträchtigen. Wir können das Crawlen, die Indexierung und das Ranking zwar nicht garantieren, es gibt aber Vorgehensweisen mit geplannten Ausfallzeiten umzugehen, ohne die Sichtbarkeit in den Suchergebnissen negativ zu beeinflussen.
Anstatt den HTTP-Statuscode 404 (nicht gefunden) zurückzugeben oder eine Fehlerseite mit dem Statuscode 200 (OK) anzuzeigen, ist es beispielsweise besser, den HTTP-Statuscode 503 (Service nicht verfügbar) zu verwenden. Dieser teilt Suchmaschinen-Crawlern mit, dass es sich um eine temporäre Downtime handelt. Des Weiteren haben Webmaster die Möglichkeit, Besuchern und Suchmaschinen-Crawlern ein voraussichtliches Datum mitzuteilen, an dem die Website wieder erreichbar ist. Hierbei kann ein optionales “Retry-After”-Header-Feld definiert werden, falls die sekundengenaue Dauer der Ausfallzeit oder das geschätzte Datum der erneuten Erreichbarkeit der Website bekannt sind. Der Googlebot kann diese Information dann ggf. verwenden, um den Zeitpunkt des erneuten Crawlens der URL zu bestimmen.
Die Rückgabe des Statuscodes 503 ist auch in einigen anderen Situationen sinnvoll. Wir begegnen häufig Problemen mit Websites, die den Statuscode 200 (OK) bei Serverproblemen, Ausfallzeiten, Bandbreitenüberschreitungen oder bei temporär nicht erreichbaren Websites (“Under Construction”) zurückgeben. Die Rückgabe des Statuscode 503 ist dabei die beste Lösung in allen zuvor genannten Situationen. Genauso wie bei geplanten Ausfallzeiten z. B. im Falle einer Hardwarewartung, ist es empfehlenswert einen zusätzlichen Server einzusetzen, welcher den Statuscode 503 zurückgibt. Jedoch ist es wichtig, dass der 503-Statuscode nicht als permanente Lösung eingesetzt wird: der langandauernde Einsatz kann ein Anzeichen dafür sein, dass eine URL dauerhaft nicht erreichbar ist und deshalb möglicherweise aus dem Google-Index entfernt wird.
Ähnlich wie beim Erstellen nützlicher 404-Seiten , ist es auch empfehlenswert eine individuelle 503-Fehlerseite bereitzustellen, die Benutzern die aktuelle Situation erklärt und darüber informiert, zu welchem Zeitpunkt die Site wieder erreichbar sein wird. Weitere Informationen bezüglich HTTP-Statuscodes findet ihr hier (Englisch): RFC 2616 .
Veröffentlicht von Tomer Honen und Kaspar Szymanski , Search Quality Team, Dublin
Anstatt den HTTP-Statuscode 404 (nicht gefunden) zurückzugeben oder eine Fehlerseite mit dem Statuscode 200 (OK) anzuzeigen, ist es beispielsweise besser, den HTTP-Statuscode 503 (Service nicht verfügbar) zu verwenden. Dieser teilt Suchmaschinen-Crawlern mit, dass es sich um eine temporäre Downtime handelt. Des Weiteren haben Webmaster die Möglichkeit, Besuchern und Suchmaschinen-Crawlern ein voraussichtliches Datum mitzuteilen, an dem die Website wieder erreichbar ist. Hierbei kann ein optionales “Retry-After”-Header-Feld definiert werden, falls die sekundengenaue Dauer der Ausfallzeit oder das geschätzte Datum der erneuten Erreichbarkeit der Website bekannt sind. Der Googlebot kann diese Information dann ggf. verwenden, um den Zeitpunkt des erneuten Crawlens der URL zu bestimmen.
Die Rückgabe des Statuscodes 503 ist auch in einigen anderen Situationen sinnvoll. Wir begegnen häufig Problemen mit Websites, die den Statuscode 200 (OK) bei Serverproblemen, Ausfallzeiten, Bandbreitenüberschreitungen oder bei temporär nicht erreichbaren Websites (“Under Construction”) zurückgeben. Die Rückgabe des Statuscode 503 ist dabei die beste Lösung in allen zuvor genannten Situationen. Genauso wie bei geplanten Ausfallzeiten z. B. im Falle einer Hardwarewartung, ist es empfehlenswert einen zusätzlichen Server einzusetzen, welcher den Statuscode 503 zurückgibt. Jedoch ist es wichtig, dass der 503-Statuscode nicht als permanente Lösung eingesetzt wird: der langandauernde Einsatz kann ein Anzeichen dafür sein, dass eine URL dauerhaft nicht erreichbar ist und deshalb möglicherweise aus dem Google-Index entfernt wird.
header('HTTP/1.1 503 Service Temporarily Unavailable');
header('Retry-After: Sat, 8 Oct 2011 18:27:00 GMT');
Beispiel für 503 (Service nicht erreichbar) Serverantwort beim Einsatz von PHP
Ähnlich wie beim Erstellen nützlicher 404-Seiten , ist es auch empfehlenswert eine individuelle 503-Fehlerseite bereitzustellen, die Benutzern die aktuelle Situation erklärt und darüber informiert, zu welchem Zeitpunkt die Site wieder erreichbar sein wird. Weitere Informationen bezüglich HTTP-Statuscodes findet ihr hier (Englisch): RFC 2616 .
Veröffentlicht von Tomer Honen und Kaspar Szymanski , Search Quality Team, Dublin