Información sobre la selección de URL entre dominios

martes, 1 de noviembre de 2011

A menudo se puede acceder a un determinado contenido a través de varias URL, aunque es posible que no todas ellas estén ubicadas en el mismo dominio. Un ejemplo habitual que hemos comentado a lo largo de los años está relacionado con la publicación del mismo contenido en varias URL, una incidencia que se conoce como " contenido duplicado ". Cuando detectamos un grupo de páginas con contenido duplicado, Google utiliza algoritmos para seleccionar una URL representativa de ese contenido. Un grupo de páginas puede contener URL del mismo sitio o de sitios diferentes. Si la URL representativa procede de un grupo que contiene diferentes sitios, la selección se denomina "selección de URL de varios dominios". Para explicar este fenómeno de forma sencilla, si el grupo de URL contiene una URL del sitio "a.com" y otra del sitio "b.com" y nuestro algoritmo selecciona la URL de "b.com", es posible que la URL de "a.com" ya no aparezca en los resultados de búsqueda y se produzca un descenso en el tráfico de búsqueda.

Los webmasters pueden ejercer una gran influencia en las selecciones de nuestros algoritmos utilizando uno de los mecanismos admitidos actualmente para indicar la URL preferida (por ejemplo, a través del elemento rel="canonical" o de redireccionamientos 301 ). En la mayoría de los casos, las decisiones tomadas por nuestros algoritmos a este respecto reflejan de forma correcta la intención del webmaster. No obstante, en casos puntuales, también hemos observado que un gran número de webmasters no entendían por qué no se había seleccionado su URL y querían saber lo que podían hacer si consideraban que la selección no era correcta.

Para explicar de forma clara las decisiones a la hora de seleccionar URL de varios dominios, vamos a publicar nuevos mensajes de las Herramientas para webmasters de Google con la intención de informar a los webmasters cuando nuestros algoritmos seleccionen una URL externa en lugar de una dirección de su sitio web. La información detallada sobre el funcionamiento de estos mensajes está disponible en el artículo del Centro de asistencia sobre este tema . No obstante, en esta entrada de blog trataremos las diferentes situaciones en las que es posible que aparezca una selección de URL de varios dominios, así como los pasos que puedes seguir para solucionar las selecciones que consideres que no son correctas.

Causas habituales de la selección de URL de varios dominios

Existe un gran número de situaciones que pueden dar lugar a una selección de URL de varios dominios por parte de nuestros algoritmos.

En la mayoría de los casos, nuestros algoritmos seleccionan una URL en función de las indicaciones implementadas por el webmaster para influir en la decisión. Por ejemplo, un webmaster que siga nuestras directrices y prácticas recomendadas relacionadas con la transferencia de sitios web estará indicando de forma eficaz que las URL de su nuevo sitio web son las que prefiere que seleccione Google. Si vas a transferir tu sitio web y aparecen estos mensajes, puedes interpretarlos como una confirmación de que nuestros algoritmos han entendido tus indicaciones.

No obstante, normalmente somos testigos de las quejas de los webmasters cuando nuestros algoritmos seleccionan una URL no deseada. Si tu sitio web se ve afectado por una selección de URL de varios dominios que consideras incorrecta, es decir, si crees que no se han seguido tus indicaciones, puedes aplicar varias estrategias para solucionar la incidencia según el caso. A continuación, se indican algunos de los motivos habituales de la selección inesperada de URL de varios dominios que hemos detectado y la forma de solucionar esta incidencia.
  1. Contenido duplicado, incluidos sitios web multirregionales : solemos observar que los webmasters utilizan básicamente el mismo contenido en el mismo idioma en varios dominios, en algunas ocasiones de forma accidental y, en otras, para orientar geográficamente el contenido. Por ejemplo, es habitual que un webmaster configure el mismo sitio web en inglés en los sitios "example.com" y "example.net" o un sitio web en alemán que esté alojado en dominios "a.de", "a.at" y "a.ch".

  2. En función de tu sitio web y de los usuarios, puedes utilizar una de las técnicas de canonicalización admitidas actualmente para indicar a nuestros algoritmos las URL que quieras que se seleccionen. Consulta los siguientes artículos relacionados con este tema:
2. Errores de configuración : determinados tipos de configuraciones incorrectas pueden hacer que nuestros algoritmos tomen una decisión equivocada. A continuación, se indican algunos ejemplos de errores de configuración.
  1. Canonicalización incorrecta : el uso incorrecto de las técnicas de canonicalización que dirigen a URL ubicadas en un sitio web externo puede dar lugar a que nuestros algoritmos seleccionen las URL externas para que se muestren en los resultados de búsqueda. Hemos detectado este tipo de errores en sistemas de administración de contenido (CMS) configurados incorrectamente o en complementos de CMS instalados por el webmaster de forma inadecuada.

    Para resolver este tipo de situaciones, debes averiguar cómo erróneamente tu sitio web está indicando la preferencia de URL canónica (por ejemplo, a través del uso incorrecto de un elemento rel="canonical" o de un redireccionamiento 301) y solucionar el error.

  2. Servidores configurados de forma incorrecta : en ocasiones, detectamos errores de configuración de alojamiento en los que el contenido del sitio "a.com" se devuelve para URL ubicadas en "b.com". Algo similar ocurre cuando dos servidores web que no están relacionados devuelven páginas 404 leves que puede que no hayamos detectado como páginas de error. En ambas situaciones, podemos asumir que se ha devuelto el mismo contenido desde dos sitios diferentes, y es posible que nuestros algoritmos seleccionen de forma incorrecta la URL del sitio "a.com" como la URL canónica del sitio "b.com".

    En ese caso, deberás investigar la parte de la infraestructura de publicación de tu sitio web que no está configurada correctamente. Por ejemplo, es posible que tu servidor devuelva códigos de estado HTTP 200 (correcto) para páginas de error o que confunda solicitudes en diferentes dominios alojados en él. Una vez que hayas encontrado la causa principal de la incidencia, ponte en contacto con los administradores de tu servidor para corregir la configuración.
3. Ataques de sitios web malintencionados: algunos ataques hacia sitios web introducen código que puede dar lugar a una canonicalización no deseada. Por ejemplo, el código malintencionado puede hacer que el sitio web devuelva un redireccionamiento 301 HTTP o inserte un elemento de enlace rel="canonical" entre dominios en el encabezado HTTP o HTML <head> que dirija normalmente a una URL externa en la que se aloje el contenido malintencionado. En estos casos, nuestros algoritmos pueden seleccionar la URL malintencionada o con spam en lugar de la URL del sitio web afectado por el error.

En esta situación, te recomendamos que sigas nuestras sugerencias relacionadas con la limpieza de tu sitio y que envíes una solicitud de reconsideración de inclusión cuando hayas terminado. Para identificar ataques encubiertos , puedes utilizar la función Explorar como Googlebot de las Herramientas para webmasters de Google para ver el contenido de tu página de la misma forma que lo hace Googlebot.
En ocasiones puntuales, nuestros algoritmos pueden seleccionar una URL de un sitio externo que aloje tu contenido sin tu permiso. Si consideras que otro sitio está duplicando tu contenido infringiendo de esta forma la ley de derechos de autor, puedes ponerte en contacto con el host del sitio para solicitar la eliminación del contenido. Asimismo, puedes solicitar que Google elimine la página infractora de los resultados de búsqueda presentando una solicitud basada en la ley estadounidense de protección de los derechos de autor (Digital Millennium Copyright Act, DMCA) .

Y, como siempre, si necesitas ayuda para identificar la causa de una decisión incorrecta o para saber cómo solucionar esta incidencia, puedes consultar el artículo del Centro de asistencia sobre este tema y publicar una pregunta en el Foro de ayuda para webmasters .