miércoles, 21 de septiembre de 2011
Es posible que ya hayáis notado que la función Organización de parámetros ha desaparecido de la sección
Configuración del sitio > Configuración
de las Herramientas para webmasters de Google. Pero no temáis; ahora podéis encontrarla bajo un nuevo nombre: ¡Parámetros de URL! Además de cambiarle el nombre, hemos actualizado y mejorado esta función. Esperamos que la encontréis todavía más útil. La configuración de los parámetros de URL realizada con la versión anterior se verá automáticamente en la versión nueva. Antes de desvelar todas las cosas interesantes que es posible hacer ahora con Parámetros de URL, os recordamos (o presentamos, si no conocíais esta función) el propósito de esta función y cuándo resulta útil emplearla.
Cuándo se utiliza
Parámetros de URL ayuda a controlar qué URL de un sitio deben ser rastreadas por el robot de Google, en función de los parámetros que aparecen en dichas URL. Esta función proporciona un método sencillo para evitar que se rastree contenido de un sitio por duplicado. Ahora es posible rastrear un sitio más eficientemente, reduciendo el uso de ancho de banda y probablemente permitiendo la indexación de más contenido único del sitio. Usar esta función puede ser una buena idea en aquellos casos en que se sospecha que la cobertura de un sitio por parte del robot de Google no es todo lo buena que podría ser. ¡Pero una gran capacidad conlleva una gran responsabilidad! Esta función solo se debe usar cuando se esté seguro del comportamiento de los parámetros de URL del sitio. En caso contrario, se podría impedir, por error, el rastreo de algunas URL, con lo cual el contenido dejaría de estar accesible para el robot de Google.
Mucho por hacer
Muy bien, pues; ahora podemos hablar de las novedades y mejoras. En primer lugar, además de asignar una acción de rastreo a un parámetro individual, ahora se puede describir el comportamiento del parámetro. Para comenzar, se indica si el parámetro sirve para alterar el contenido de la página o no. Si el parámetro no afecta al contenido de la página, entonces ya está todo hecho. El robot Google seleccionará URL con un valor representativo de ese parámetro y rastreará las URL con ese valor. Cualquier valor elegido es válido, ya que el parámetro no altera el contenido. No obstante, si el parámetro sí que cambia el contenido de una página, ahora es posible asignar una de cuatro estrategias de rastreo para que Google la utilice con ese parámetro:
De las cuatro opciones de la lista anterior, la opción "Ninguna URL" es nueva y merece una atención especial. Esta opción es la más restrictiva y, para una URL en particular, tiene precedencia sobre la configuración de otros parámetros que pueda contener esa URL. Esto significa que si esa URL contiene un parámetro para el cual se ha configurado la opción "Ninguna URL", esa URL no se rastreará nunca, incluso aunque para otros parámetros de URL se haya seleccionado "Todas las URL". Esta opción se debe usar con cuidado. El segundo ajuste más restrictivo es "Solo URL con el valor = x".
Veámoslo en acción
Ahora vamos a hacer algo divertido y ejercitar las neuronas con un ejemplo:
Como era de esperar por su naturaleza, CuriosoPreguntón no pudo evitar empezar a hacer preguntas:
CuriosoPreguntón : le has indicado al robot de Google que elija una URL de representación para trackingId (un valor elegido por el robot de Google). ¿Por qué no seleccionar "Solo URL con el valor = x" y elegir yo mismo el valor?
GranMagoWeb : mientras rastreaba la Web, el robot de Google ha descubierto las URL siguientes enlazando a vuestro sitio:
CuriosoPreguntón : ¿Qué hay del parámetro sortOrder ? No me importa que los elementos aparezcan en la lista en orden ascendente o descendente. Por qué no dejamos que Google decida un valor representativo?
GranMagoWeb : A medida que el robot de Google rastree podría encontrar las URL siguientes:
CuriosoPreguntón : ¿Qué hay del valor de sortBy ?
GranMagoWeb : es un caso muy parecido al atributo sortOrder. Te interesa que las URL que se rastreen de tus listados estén ordenadas de forma consistente en todas las páginas, ya que de lo contrario, algunos artículos podrían quedar fuera del alcance del robot de Google. Sin embargo, debes ir con cuidado al elegir un valor. Si en tu tienda se venden libros y zapatos, sería mejor no seleccionar el valor "title" porque las URL que apunten a zapatos nunca contendrán "sortBy=title" y, en consecuencia, no se rastrearán. De forma parecida, "sortBy=size" funciona bien para rastrear los zapatos, pero no para los libros. Ten en cuenta que la configuración de los parámetros afecta a todo el sitio web.
CuriosoPreguntón : ¿Por qué no rastrear las URL con el parámetro filterByColor ?
GranMagoWeb : imagínate que tienes una lista de faldas de tres páginas. Unas cuantas son azules, otras son rojas y otras son verdes.
Si un sitio tiene parámetros de URL que puedan generar incidencias de duplicación de contenido, deberíais probar la nueva función Parámetros de URL de las Herramientas para webmasters de Google. Os invitamos a contarnos vuestras opiniones y, si tenéis alguna pregunta, no dudéis en enviarla al Foro de ayuda para webmasters .
Publicado por Kamila Primke, Ingeniero de software, equipo de Herramientas para webmasters de Google
Cuándo se utiliza
Parámetros de URL ayuda a controlar qué URL de un sitio deben ser rastreadas por el robot de Google, en función de los parámetros que aparecen en dichas URL. Esta función proporciona un método sencillo para evitar que se rastree contenido de un sitio por duplicado. Ahora es posible rastrear un sitio más eficientemente, reduciendo el uso de ancho de banda y probablemente permitiendo la indexación de más contenido único del sitio. Usar esta función puede ser una buena idea en aquellos casos en que se sospecha que la cobertura de un sitio por parte del robot de Google no es todo lo buena que podría ser. ¡Pero una gran capacidad conlleva una gran responsabilidad! Esta función solo se debe usar cuando se esté seguro del comportamiento de los parámetros de URL del sitio. En caso contrario, se podría impedir, por error, el rastreo de algunas URL, con lo cual el contenido dejaría de estar accesible para el robot de Google.
Mucho por hacer
Muy bien, pues; ahora podemos hablar de las novedades y mejoras. En primer lugar, además de asignar una acción de rastreo a un parámetro individual, ahora se puede describir el comportamiento del parámetro. Para comenzar, se indica si el parámetro sirve para alterar el contenido de la página o no. Si el parámetro no afecta al contenido de la página, entonces ya está todo hecho. El robot Google seleccionará URL con un valor representativo de ese parámetro y rastreará las URL con ese valor. Cualquier valor elegido es válido, ya que el parámetro no altera el contenido. No obstante, si el parámetro sí que cambia el contenido de una página, ahora es posible asignar una de cuatro estrategias de rastreo para que Google la utilice con ese parámetro:
- Dejar que Googlebot decida,
- Todas las URL
- Solo URL con el valor = x
- Ninguna URL
De las cuatro opciones de la lista anterior, la opción "Ninguna URL" es nueva y merece una atención especial. Esta opción es la más restrictiva y, para una URL en particular, tiene precedencia sobre la configuración de otros parámetros que pueda contener esa URL. Esto significa que si esa URL contiene un parámetro para el cual se ha configurado la opción "Ninguna URL", esa URL no se rastreará nunca, incluso aunque para otros parámetros de URL se haya seleccionado "Todas las URL". Esta opción se debe usar con cuidado. El segundo ajuste más restrictivo es "Solo URL con el valor = x".
Veámoslo en acción
Ahora vamos a hacer algo divertido y ejercitar las neuronas con un ejemplo:
- - -
Había una vez una tienda online,
modaencantada.example.com
. El sitio web empleaba parámetros de URL y se podía acceder al mismo contenido a través de múltiples URL. Un día, el propietario de la tienda pensó que, con tantas URL redundantes, tal vez el robot de Google no podía rastrear su sitio a fondo. Así que envió a su asistente CuriosoPreguntón a ver al GranMagoWeb para obtener su consejo sobre cómo usar la función Parámetros de URL para reducir el contenido duplicado rastreado por el robot de Google. El GranMagoWeb era famoso por su sabiduría. Echó un vistazo a los parámetros de la URL y de inmediato propuso la siguiente configuración:
Nombre del parámetro | ¿Influencia en el contenido? | ¿Qué debería Googlebot rastrear? |
---|---|---|
trackingId | Ninguna | Una URL de representación |
sortOrder | Ordena el contenido | Solo URL con el valor = ‘lowToHigh’ |
sortBy | Ordena el contenido | Solo URL con el valor = ‘price’ |
filterByColor | Restringe el contenido | Ninguna URL |
itemId | Especifica el contenido | Todas las URL |
page | Pagina el contenido | Todas las URL |
Como era de esperar por su naturaleza, CuriosoPreguntón no pudo evitar empezar a hacer preguntas:
CuriosoPreguntón : le has indicado al robot de Google que elija una URL de representación para trackingId (un valor elegido por el robot de Google). ¿Por qué no seleccionar "Solo URL con el valor = x" y elegir yo mismo el valor?
GranMagoWeb : mientras rastreaba la Web, el robot de Google ha descubierto las URL siguientes enlazando a vuestro sitio:
- modaencantada.example.com/faldas/?trackingId=aaa123
- modaencantada.example.com/faldas/?trackingId=aaa124
- modaencantada.example.com/pantalones/?trackingId=aaa125
CuriosoPreguntón : ¿Qué hay del parámetro sortOrder ? No me importa que los elementos aparezcan en la lista en orden ascendente o descendente. Por qué no dejamos que Google decida un valor representativo?
GranMagoWeb : A medida que el robot de Google rastree podría encontrar las URL siguientes:
- modaencantada.example.com/faldas/?pagina=1&sortOrder=price&sortOrder=’lowToHigh’
- modaencantada.example.com/faldas/?pagina=1&sortOrder=price&sortOrder=’HighToLow’
- modaencantada.example.com/faldas/?pagina=2&sortOrder=price&sortOrder=’lowToHigh’
- modaencantada.example.com/faldas/?pagina=2&sortOrder=price&sortOrder=’HighToLow’
- modaencantada.example.com/faldas/?pagina=1&sortBy=price&sortOrder=’lowToHigh’
- modaencantada.example.com/faldas/?pagina=2&sortBy=price&sortOrder=’HighToLow’
CuriosoPreguntón : ¿Qué hay del valor de sortBy ?
GranMagoWeb : es un caso muy parecido al atributo sortOrder. Te interesa que las URL que se rastreen de tus listados estén ordenadas de forma consistente en todas las páginas, ya que de lo contrario, algunos artículos podrían quedar fuera del alcance del robot de Google. Sin embargo, debes ir con cuidado al elegir un valor. Si en tu tienda se venden libros y zapatos, sería mejor no seleccionar el valor "title" porque las URL que apunten a zapatos nunca contendrán "sortBy=title" y, en consecuencia, no se rastrearán. De forma parecida, "sortBy=size" funciona bien para rastrear los zapatos, pero no para los libros. Ten en cuenta que la configuración de los parámetros afecta a todo el sitio web.
CuriosoPreguntón : ¿Por qué no rastrear las URL con el parámetro filterByColor ?
GranMagoWeb : imagínate que tienes una lista de faldas de tres páginas. Unas cuantas son azules, otras son rojas y otras son verdes.
- modaencantada.example.com/faldas/?pagina=1
- modaencantada.example.com/faldas/?pagina=2
- modaencantada.example.com/faldas/?pagina=3
- modaencantada.example.com/faldas/?pagina=1&filterByColor=azul
- modaencantada.example.com/faldas/?pagina=2&filterByColor=azul
- - -
Si un sitio tiene parámetros de URL que puedan generar incidencias de duplicación de contenido, deberíais probar la nueva función Parámetros de URL de las Herramientas para webmasters de Google. Os invitamos a contarnos vuestras opiniones y, si tenéis alguna pregunta, no dudéis en enviarla al Foro de ayuda para webmasters .
Publicado por Kamila Primke, Ingeniero de software, equipo de Herramientas para webmasters de Google