Diagnóstico avanzado de páginas web con las Herramientas para Webmasters de Google

jueves, 13 de noviembre de 2008

Mantener una página web puede ser complicado, por eso ofrecemos las Herramientas para Webmasters que ayudan a los webmasters a reconocer supuestas incidencias antes de que se conviertan en problemas reales. Algunas de las incidencias puede que sean relativamente pequeñas (como la duplicación en títulos y descripciones ) [ inglés ] , otras pueden ser mayores (como que tu sitio web no pueda ser rastreado). Aunque las Herramientas para Webmasters de Google no pueden decirte exactamente lo que tienes que cambiar, pueden ayudarte a ver que hay un problema al que necesitas prestar atención.

Vamos a echar un vistazo a varios ejemplos que nos hemos encontrado en los Grupos de Ayuda para Webmasters de Google :

¿Trata tu servidor como a un visitante normal y corriente?

Mientras Googlebot intenta funcionar como un usuario normal y corriente, algunos servidores pueden confundirse y funcionar de formas muy extrañas. Por ejemplo, aunque tu servidor funcione de forma impecable la mayor parte del tiempo, algunos servidores bajo IIS pueden responder con un error de servidor (u otras respuestas relacionadas con un error en el servidor) cuando es visitado por un usuario con el user-agent de Googlebot. En el Centro de Ayuda para Webmasters, hemos visto servidores IIS dando un código 500 (Error en servidor) [ inglés ] y 404 (Archivo no encontrado) [ inglés ] en la sección de "Rastreo Web" de Diagnósticos, así como también un código 302 cuando se ha enviado un archivo de Sitemaps [ inglés ] . Si tu servidor redirige a una página de error, deberías comprobar que podemos rastrear esta página de error y que devuelve el código correcto. Una vez que hayas hecho esto, nosotros también podremos enseñarte esos errores en las Herramientas para Webmasters. Para más información sobre este problema y sus posibles soluciones, consulta https://todotnet.com/archive/0001/01/01/7472.aspx [ inglés ] y https://www.kowitz.net/archive/2006/12/11/asp.net-2.0-mozilla-browser-detection-hole.aspx [ inglés ] .

Si tu página web está alojada en servidores Microsoft IIS, recuerda también que por defecto las URLs distinguen entre mayúsculas y minúsculas [ inglés ] (y nosotros también). Esto incluye las URLs en el archivo robots.txt , y es algo con lo que deberías tener cuidado si tu servidor está usando URLs que distinguen entre mayúsculas y minúsculas. Por ejemplo, "disallow: /paris" bloqueará /paris pero no /Paris.

¿Tiene tu sitio web enlaces rotos de forma sistemática?

Los sistemas de gestión de contenido actuales pueden crear de forma muy sencilla problemas que afectan a un gran número de páginas. Algunas veces estos problemas son muy sencillos de encontrar cuando estas visualizando las páginas; otras veces son un poco más difíciles de encontrarlos por ti mismo. Si uno de estos problemas crea un gran número de enlaces rotos, por lo general podrás verlo en la sección "Rastreo Web" de Diagnósticos en tu cuenta de las Herramientas para Webmasters (siempre que esos enlaces rotos devuelvan un código de error 404). En una caso reciente, una página web tenía un pequeño problema de código en su feed RSS [ inglés ] , que daba como resultado unas 60.000 URLs erróneas encontradas y que se mostraban en su cuenta de las Herramientas para Webmasters. Como puedes imaginar, nosotros preferimos estar rastreando contenido en lugar de esos errores 404 :-).

¿Redirige tu sitio web a los usuarios hacia otra parte?

Para algunos sitios web, tiene sentido concentrarse en un grupo de usuarios de una determinada área geográfica. Una forma de hacer esto es redirigir usuarios de otra zona geográfica a una página diferente. Sin embargo, ten en cuenta que Googlebot puede que no rastree dentro del área seleccionada, así que puede que éste también sea redireccionado. Esto significaría que Googlebot no será capaz de acceder a tu página de inicio. Si esto ocurriese, lo más probable es que las Herramientas para Webmasters tengan problemas cuando traten de verificar el código en tu sitio web y cuyo resultado sería un sitio sin verificar [ inglés ] . Esta no es la única razón por la que un sitio pueda estar sin verificar, pero si notas que esto ocurre habitualmente, es una buena idea investigarlo. Sobre este tema, debes estar seguro de que siempre se trata a Googlebot como a un usuario de esa zona geográfica, sino podría verse como una técnica de encubrimiento [ inglés ] .

¿Está tu servidor no disponible cuando tratamos de rastrear tu web?

Esto puede ocurrirle a los mejores sitios (los servidores pueden caerse y los cortafuegos pueden proteger demasiado). Si esto ocurre cuando Googlebot intenta acceder a tu sitio, no seremos capaces de rastrearlo e incluso notarás que ni lo hemos intentado. Afortunadamente, nosotros hacemos seguimiento de estos problemas y podrás verlo como errores "Red no encontrada" and "robots.txt no encontrado" [ inglés ] en tu cuenta de las Herramientas para Webmasters cuando no podamos acceder a tu web.

¿Han hackeado tu sitio?

Algunas veces los hackers esconden contenido extraño, no relacionado y con enlaces a páginas web de dudosa calidad. Si está escondido, puede que no lo hayas notado enseguida, pero no obstante, esto puede ser un gran problema. Aunque el Centro de Mensajes puede ofrecerte una advertencia sobre cierto tipo de texto escondido, lo mejor es que además tu le eches un ojo. Las Herramientas para Webmaster de Google pueden enseñarte las palabras clave para tus páginas en la sección "Estadísticas detectadas por Googlebot" [ inglés ] , así que a menudo puedes ver que ha sido hackeado desde esa sección. Si ves que hay palabras clave completamente irrelevantes, puede ser una buena idea investigar qué está pasando. Además puedes configurar Alertas Google o mirar búsquedas como: [site:example.com palabras spam], donde "palabras spam" pueden ser palabras como porn, viagra, tramadol, sex u otras palabras que tu sitio web normalmente no mostraría. Si descubres que tu sitio web ha sido hackeado, te recomiendo revisar nuestro post sobre qué hay que hacer después de haber sido hackeado [ inglés ] .

Hay un motón de problemas que pueden ser encontrados con las Herramientas para Webmasters: estos son algunos de los más comunes que hemos visto últimamente. Y puesto que puede ser realmente difícil reconocer algunos de esos problemas, es una buena idea revisar tu cuenta de las Herramientas para Webamsters y estar seguro de que puedes ver las incidencias antes de que ellas se conviertan en un problema real. Si encuentras algo que no puedes precisar, por qué no publicarlo en el Grupo de discusión y pedir ayuda a los expertos.

¿Has revisado tu sitio últimamente?