Cómo administrar el rastreo de URLs de navegación por facetas

La navegación por facetas es una función común de los sitios web que permite a los visitantes cambiar la forma en que se muestran los elementos (por ejemplo, productos, artículos o eventos) en una página. Es una función popular y útil. Sin embargo, su implementación más común, que se basa en parámetros de URL, puede generar espacios de URL infinitos que perjudican al sitio web de varias maneras:

  • Rastreo excesivo: Debido a que las URLs creadas para la navegación por facetas parecen ser nuevas y los rastreadores no pueden determinar si las URLs serán útiles sin rastrearlas primero, los rastreadores suelen acceder a una gran cantidad de URLs de navegación por facetas antes de que los procesos determinen que las URLs son, de hecho, inútiles.
  • Rastreos de descubrimiento más lentos: Como se mencionó en el punto anterior, si el rastreo se dedica a URLs que no son útiles, los rastreadores tienen menos tiempo para dedicar a las URLs nuevas y útiles.

Una URL de navegación por facetas típica puede contener varios parámetros en la cadena de consulta relacionados con las propiedades de los elementos que filtran. Por ejemplo:

https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny

Si cambias cualquiera de los parámetros de URL products, color y size, se mostrará un conjunto diferente de elementos en la página subyacente. Esto suele implicar una gran cantidad de combinaciones posibles de filtros, lo que se traduce en una gran cantidad de URLs posibles. Para ahorrar recursos, te recomendamos que trates estas URLs de una de las siguientes maneras:

  • Si no necesitas que las URLs de navegación por facetas se indexen, evita el rastreo de estas URLs.
  • Si necesitas que las URLs de navegación por facetas se indexen, asegúrate de que sigan nuestras prácticas recomendadas detalladas en la siguiente sección. Ten en cuenta que el rastreo de URLs por facetas suele costar a los sitios grandes cantidades de recursos de procesamiento debido a la gran cantidad de URLs y operaciones necesarias para renderizar esas páginas.

Evita el rastreo de URLs de navegación por facetas

Si quieres ahorrar recursos del servidor y no necesitas que tus URLs de navegación por facetas aparezcan en la Búsqueda de Google, puedes evitar el rastreo de estas URLs de una de las siguientes maneras.

  • Usa robots.txt para no permitir el rastreo de URLs de navegación por facetas. A menudo, no hay una buena razón para permitir el rastreo de elementos filtrados, ya que consume recursos del servidor sin ningún beneficio o con un beneficio mínimo. En su lugar, permite el rastreo solo de las páginas de los elementos individuales junto con una página de ficha dedicada que muestre todos los productos sin filtros aplicados.
    user-agent: Googlebot
    disallow: /*?*products=
    disallow: /*?*color=
    disallow: /*?*size=
    allow: /*?products=all$
    
  • Usa fragmentos de URL para especificar filtros. Por lo general, la Búsqueda de Google no admite fragmentos de URL en el rastreo y la indexación. Si tu mecanismo de filtrado se basa en fragmentos de URL, no tendrá ningún impacto en el rastreo (positivo ni negativo). Por ejemplo, en lugar de parámetros de URL, usa fragmentos de URL:
    https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny

Otras formas de indicar una preferencia de qué URLs de navegación por facetas rastrear (o no) es usar el elemento link rel="canonical" y el atributo de ancla rel="nofollow". Sin embargo, estos métodos suelen ser menos eficaces a largo plazo que los métodos mencionados anteriormente.

  • Con el uso de rel="canonical" para especificar qué URL es la versión canónica de una URL de navegación por facetas, es posible que, con el tiempo, disminuya el volumen de rastreo de las versiones no canónicas de esas URLs. Por ejemplo, si tienes 3 tipos de páginas filtradas, considera dirigir rel="canonical" a la versión no filtrada: https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny especifica <link rel="canonical" href="https://example.com/items.shtm?products=fish" >.
  • Puede ser beneficioso usar atributos rel="nofollow" en los puntos de anclaje que dirigen a páginas de resultados filtrados. Sin embargo, ten en cuenta que cada punto de anclaje que dirija a una URL específica debe tener el atributo rel="nofollow" para que sea eficaz.

Asegúrate de que las URLs de navegación por facetas sean óptimas para la Web

Si necesitas que tus URLs de navegación por facetas se rastreen y indexen, asegúrate de seguir estas prácticas recomendadas para minimizar los efectos negativos del rastreo de la gran cantidad de URLs potenciales de tu sitio:

  1. Usa el separador de parámetros de URL estándar de la industria ("&"). Los rastreadores tienen dificultades para detectar caracteres como la coma (,), el punto y coma (;) y los corchetes ([ y ]) como separadores de parámetros (porque, a menudo, no lo son).
  2. Si codificas filtros en la ruta de URL, como /products/fish/green/tiny, asegúrate de que el orden lógico de los filtros siempre sea el mismo y de que no haya filtros duplicados.
  3. Muestra un código de estado HTTP 404 cuando una combinación de filtros no muestra resultados. Si no hay "peces verdes" en el inventario del sitio, los usuarios y los rastreadores deberían recibir el error de "no encontrado" con el código de estado HTTP correcto (404). Esto también debería ser el caso si la URL contiene filtros duplicados o combinaciones de filtros sin sentido, y URLs de paginación inexistentes. Del mismo modo, si una combinación de filtros no tiene resultados, no redirecciona a una página de error común de "no encontrado". En su lugar, muestra un error de "no encontrado" con el código de estado HTTP 404 en la URL en la que se encontró.