Gestionar el rastreo de URLs de navegación por facetas

La navegación por facetas es una función habitual de los sitios web que permite a los visitantes cambiar la forma en que se muestran los elementos (por ejemplo, productos, artículos o eventos) en una página. Es una función popular y útil, pero su implementación más común, que se basa en parámetros de URL, puede generar espacios de URL infinitos, lo que perjudica al sitio web de dos formas:

  • Exceso de rastreo: como las URLs creadas para la navegación por facetas parecen novedosas y los rastreadores no pueden determinar si las URLs van a ser útiles sin rastrearlas primero, los rastreadores suelen acceder a un número muy grande de URLs de navegación por filtros antes de que los procesos de los rastreadores determinen que las URLs son, en realidad, inútiles.
  • Rastreos de descubrimiento más lentos: en relación con el punto anterior, si se rastrean URLs inútiles, los rastreadores tienen menos tiempo para dedicarlo a URLs nuevas y útiles.

Una URL de navegación por filtros típica puede contener varios parámetros en la cadena de consulta relacionados con las propiedades de los elementos que se filtran. Por ejemplo:

https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny

Si cambias cualquiera de los parámetros de URL products, color y size, se mostrará un conjunto de elementos diferente en la página subyacente. Esto suele implicar un número muy elevado de combinaciones de filtros, lo que se traduce en un número muy elevado de URLs posibles. Para ahorrar recursos, te recomendamos que gestiones estas URLs de una de las siguientes formas:

  • Si no necesitas que se indexen las URLs de la navegación por facetas, evita que se rastreen.
  • Si necesitas que las URLs de navegación por facetas se puedan indexar, asegúrate de que sigan las prácticas recomendadas que se describen en la siguiente sección. Ten en cuenta que el rastreo de URLs con facetas suele costar a los sitios grandes cantidades de recursos informáticos debido a la gran cantidad de URLs y operaciones necesarias para renderizar esas páginas.

Impedir que se rastreen URLs de navegación por facetas

Si quieres ahorrar recursos del servidor y no necesitas que las URLs de navegación por filtros aparezcan en la Búsqueda de Google, puedes impedir que se rastreen siguiendo uno de los métodos que se indican a continuación.

  • Utiliza robots.txt para impedir que se rastreen las URLs de la navegación por facetas. A menudo, no hay ningún motivo para permitir que se rastreen los elementos excluidos, ya que consume recursos del servidor sin ningún beneficio o con un beneficio mínimo. En su lugar, permite que se rastreen solo las páginas de los elementos individuales, junto con una página de listado específica que muestre todos los productos sin aplicar filtros.
    user-agent: Googlebot
    disallow: /*?*products=
    disallow: /*?*color=
    disallow: /*?*size=
    allow: /*?products=all$
    
  • Utiliza fragmentos de URL para especificar filtros. La Búsqueda de Google no suele admitir fragmentos de URL en el rastreo ni en la indexación. Si tu mecanismo de filtrado se basa en fragmentos de URL, no afectará al rastreo (ni positivamente ni negativamente). Por ejemplo, en lugar de usar parámetros de URL, usa fragmentos de URL:
    https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny

También puedes indicar qué URLs de navegación por facetas se deben rastrear (o no) mediante el elemento rel="canonical" link y el atributo de ancla rel="nofollow". Sin embargo, estos métodos suelen ser menos eficaces a largo plazo que los métodos mencionados anteriormente.

  • Usar rel="canonical" para especificar qué URL es la versión canónica de una URL de navegación por facetas puede reducir con el tiempo el volumen de rastreo de las versiones no canónicas de esas URLs. Por ejemplo, si tienes tres tipos de páginas filtradas, te recomendamos que apuntes rel="canonical" a la versión sin filtrar: https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny especifica <link rel="canonical" href="https://example.com/items.shtm?products=fish" >.
  • Puede ser útil usar atributos rel="nofollow" en los atributos de los enlaces ancla que dirigen a páginas de resultados filtradas, pero ten en cuenta que todos los enlaces ancla que dirijan a una URL específica deben tener el atributo rel="nofollow" para que sea eficaz.

Asegúrate de que las URLs de navegación por facetas sean óptimas para la Web

Si quieres que las URLs de la navegación por facetas se rastreen e indexen, sigue estas prácticas recomendadas para minimizar los efectos negativos del rastreo de la gran cantidad de URLs potenciales de tu sitio:

  1. Utiliza el separador de parámetros de URL estándar del sector, &. Los caracteres como la coma (,), el punto y coma (;) y los paréntesis ([ y ]) son difíciles de detectar como separadores de parámetros para los rastreadores (ya que, a menudo, no son separadores).
  2. Si codificas filtros en la ruta de la URL, como /products/fish/green/tiny, asegúrate de que el orden lógico de los filtros siempre sea el mismo y de que no haya filtros duplicados.
  3. Devuelve un código de estado HTTP 404 cuando una combinación de filtros no devuelva resultados. Si no hay peces verdes en el inventario del sitio, tanto los usuarios como los rastreadores deberían recibir un error "no encontrado" con el código de estado HTTP adecuado (404). También debería ocurrir lo mismo si la URL contiene filtros duplicados o combinaciones de filtros que no tengan sentido, así como URLs de paginación inexistentes. Del mismo modo, si una combinación de filtros no devuelve resultados, no redirijas a una página de error común "no encontrado". En su lugar, devuelve un error de "no encontrado" con el código de estado HTTP 404 en la URL donde se ha detectado.