Lunes, 12 de marzo de 2012
Los errores de rastreo son una de las funciones más populares de las Herramientas para webmasters de Google. Es por eso que hoy lanzamos algunas mejoras muy importantes que harán que sea aún más útil.
Ahora detectamos varios tipos de errores nuevos y los informamos. Para comprender los datos nuevos, dividimos los errores en dos partes: los errores del sitio y los errores de URL.
Errores del sitio
Los errores del sitio no son específicos de una URL en particular: afectan a todo el sitio. Entre estos errores, se incluyen las fallas de resolución de DNS, los problemas de conectividad con el servidor web y los problemas para recuperar el archivo robots.txt. Solíamos informar estos errores por URL, pero no tenía mucho sentido porque no son específicos de las URLs individuales. De hecho, incluso evitan que Googlebot solicite una URL. En cambio, ahora hacemos un seguimiento de los índices de error para cada tipo de error en todo el sitio. Además, intentaremos enviarte alertas cuando estos errores sean lo suficientemente frecuentes como para prestarles atención.
Además, si no tienes (ni tuviste recientemente) ningún problema en estas áreas, como es el caso de muchos sitios, no te molestaremos con esta sección. En su lugar, solo te mostraremos marcas de verificación amigables para informarte que todo está de maravillas.
Errores de URL
Los errores de URL son específicos de una página en particular. Esto significa que, cuando Googlebot intenta rastrear la URL, puede resolver el DNS, conectarse al servidor, recuperar y leer el archivo robots.txt y solicitar esa URL, pero se produce un error después de ese proceso. Desglosamos los errores de URL en varias categorías según la causa del error. Si tu sitio publica datos de Google Noticias o de dispositivos móviles (CHTML/XHTML), mostraremos diferentes categorías para esos errores.
Menos es más
Solíamos mostrar, como máximo, 100,000 errores de cada tipo. Sin embargo, intentar procesar toda esta información era abrumador, y no había forma de saber cuáles de esos errores eran importantes (tu página principal está inactiva) o menos importantes (alguien cometió un error tipográfico cuando quiso vincular su sitio con el tuyo). No había una manera realista de ver los 100,000 errores, ni de ordenar, buscar o marcar el progreso. En la versión nueva de esta función, nos enfocamos en mostrar, por adelantado, solo los errores más importantes. Para cada categoría, te mostraremos los 1,000 errores más importantes que permiten una acción. Puedes ordenar y filtrar estos 1,000 errores principales, y avisarnos cuando los hayas corregido para verlos en detalle.
Algunos sitios tienen más de 1,000 errores de un tipo determinado, por lo que aún podrás ver la cantidad total de errores para cada tipo y un gráfico que muestra los datos históricos de los últimos 90 días. A los que les preocupa que 1,000 detalles de error y un recuento total agregado no sean suficientes, consideramos agregar un acceso programático (una API) para que puedas descargar cada último error que tengas. Si necesitas más, envíanos tus comentarios.
También quitamos la lista de páginas bloqueadas por robots.txt. Si bien pueden ser útiles para diagnosticar problemas con el archivo robots.txt, por lo general, son páginas que se bloquean de manera intencional. Queríamos enfocarnos en los errores, por lo que buscamos información sobre las URLs bloqueadas para que aparezcan pronto en la función "Acceso del rastreador" en "Configuración del sitio".
Obtén información detallada
Cuando haces clic en una URL de error individual que figura en la lista principal, aparece un panel de detalles con información adicional, que incluye la última vez que se intentó rastrear la URL, la primera vez que se detectó un problema y una explicación breve del error.
En el panel de detalles, puedes hacer clic en el vínculo de la URL que provocó el error para ver lo que sucede cuando intentas visitarla. También, puedes marcar el error como "corregido" (brindaremos más información más adelante), ver el contenido de ayuda para ese tipo específico, enumerar los mapas del sitio que contengan la URL, ver otras páginas que se vinculen a la URL o incluso hacer que Googlebot recupere la URL en ese momento, ya sea para obtener más información o para verificar que la corrección haya funcionado.
Toma medidas
Uno de los mejores aspectos de esta versión nueva de la función de errores de rastreo es que te puedes enfocar en corregir lo más importante primero. Clasificamos los errores de modo que los que aparezcan en la parte superior de la lista de prioridad sean los que puedas solucionar, por ejemplo, vínculos rotos en tu sitio, errores en el software del servidor, actualización de mapas del sitio para reducir las URLs muertas o adición de redireccionamientos 301
que lleven a los usuarios a las páginas "reales". Se determinó, según diversos factores (por ejemplo, si se incluyó o no la URL en un mapa del sitio), la cantidad de sitios desde los que se vincula (y si alguno de esos también está en tu sitio) o si la URL recibió tráfico de una búsqueda hace poco tiempo.
Cuando creas que corregiste el problema (puedes recuperar la URL como Googlebot para probar la corrección que realizaste), si eres un usuario con permisos de acceso completo, puedes marcar el error como "corregido". Con esta acción se quitará el error de tu lista. En el futuro, los errores que hayas marcado como corregidos no se incluirán en la lista de errores principales, a menos que los volvamos a detectar en un rastreo de URL subsiguiente.
Trabajamos mucho en la nueva función de errores de rastreo, por eso esperamos que te resulte muy útil. Cuéntanos tu opinión. Si tienes alguna sugerencia, visita nuestro foro.