Explicamos la eliminación de URLs (parte I): URLs y directorios

Martes, 30 de marzo de 2010

Actualmente, hay mucho contenido en Internet. En algún momento, es posible que aparezca algo en línea que preferirías que no esté allí, desde una entrada de blog provocadora que lamentas haber publicado hasta datos confidenciales que se expusieron accidentalmente. En la mayoría de los casos, si borras o restringes el acceso al contenido, este saldrá de los resultados de la búsqueda de forma natural después de un tiempo. Sin embargo, si necesitas quitar con urgencia contenido no deseado que Google indexó y no puedes esperar a que desaparezca naturalmente, puedes usar nuestra herramienta de eliminación de URL para acelerar la eliminación de contenido de nuestra búsqueda siempre y cuando cumpla con ciertos criterios (que veremos a continuación).

Creamos una serie de entradas de blog para explicar cómo quitar correctamente varios tipos de contenido y cómo evitar errores comunes. En esta primera publicación, abordaremos algunas situaciones básicas: quitar una sola URL, un directorio o un sitio completo, y volver a incluir contenido que se quitó. También te recomendamos nuestra entrada anterior sobre cómo administrar la información disponible sobre ti en Internet.

Cómo quitar una sola URL

En general, para que las solicitudes de eliminación se realicen de forma correcta, el propietario de las URLs en cuestión, ya seas tú o otra persona, debe indicar que está bien quitar ese contenido. Para una URL individual, esto se puede indicar de tres maneras:

Antes de enviar una solicitud de eliminación, puedes verificar si la URL está correctamente bloqueada:

  • robots.txt: Para verificar si la URL está correctamente inhabilitada, usa Explorar como Googlebot o Probar robots.txt en las Herramientas para webmasters.
  • Etiqueta noindex meta: Puedes usar Explorar como Googlebot para asegurarte de que la etiqueta meta aparezca entre las etiquetas <head> y </head>. Si quieres ver una página que no puedes verificar en las Herramientas para webmasters, puedes abrir la URL en un navegador. Para ello, ve a Ver > Código fuente de la página y asegúrate de ver la etiqueta meta entre las etiquetas <head> y </head>.
  • Código de estado 404 y 410: Puedes usar Explorar como Googlebot o herramientas como Encabezados HTTP en tiempo real o web-sniffer.net para verificar si la URL muestra el código correcto. A veces, las páginas "borradas" pueden decir "404" o "No se encontró" en la página, pero en realidad mostrar un código de estado 200 en el encabezado, por lo que es recomendable usar una herramienta de verificación de encabezados adecuada.

Si se quitó contenido no deseado de una página, pero esta no se bloqueó de ninguna de las maneras anteriores, no podrás quitar esa URL por completo de nuestros resultados de la búsqueda. Esto es más común cuando no eres el propietario del sitio que aloja ese contenido. Cubrimos lo que debes hacer en esta situación en una publicación posterior de la Parte II de nuestra serie sobre eliminaciones.

Si una URL cumple con uno de los criterios anteriores, puedes quitarla si vas a la herramienta Eliminaciones, ingresas la URL que deseas quitar y seleccionas la opción correspondiente a "El webmaster ya bloqueó la página". Ten en cuenta que debes ingresar la URL en la que se aloja el contenido, no la de la Búsqueda de Google donde aparece. Por ejemplo, ingresa https://www.example.com/embarrassing-stuff.html, no https://www.google.com/search?q=embarrassing+stuff.

En este artículo del Centro de ayuda, encontrarás más información para asegurarte de ingresar la URL correcta. Recuerda que si no nos indicas la URL exacta que te causa problemas, no podremos quitar el contenido que tenías en mente.

Cómo quitar un directorio o sitio completo

Para que se quite correctamente un directorio o sitio, este debe inhabilitarse en el archivo robots.txt del sitio. Por ejemplo, para quitar el directorio https://www.example.com/secret/, tu archivo robots.txt debe incluir lo siguiente:

User-agent: *
Disallow: /secret/

No es suficiente que la raíz del directorio muestre un código de estado 404, ya que es posible que un directorio muestre un 404, pero siga entregando archivos en su interior. El uso de robots.txt para bloquear un directorio (o un sitio completo) garantiza que también se bloqueen todas las URLs que contiene ese directorio (o sitio). Puedes probar si un directorio se bloqueó de forma correcta mediante Explorar como Googlebot o Probar robots.txt en las Herramientas para webmasters.

Solo los propietarios verificados de un sitio pueden solicitar la eliminación de todo un sitio o directorio en las Herramientas para webmasters. Para solicitar la eliminación de un directorio o sitio, haz clic en el sitio en cuestión y ve a Configuración del sitio > Acceso del rastreador > Remove URL. Si ingresas la raíz de tu sitio como URL que quieres quitar, se te pedirá que confirmes si deseas quitar todo el sitio. Si ingresas un subdirectorio, selecciona la opción "Quitar directorio" en el menú desplegable.

Cómo volver a incluir contenido

Puedes cancelar las solicitudes de eliminación de cualquier sitio de tu propiedad, incluidas las que hayan enviado otras personas, cuando quieras. Para ello, debes ser un propietario verificado de este sitio en las Herramientas para webmasters. Una vez que hayas verificado la propiedad, puedes ir a Configuración del sitio > Acceso del rastreador > Remove URL > Removed URLs (o > Made by others) y haz clic en "Cancelar" junto a las solicitudes que quieras cancelar.

¿Tienes más preguntas? No te pierdas el resto de nuestra serie sobre cómo quitar contenido de los resultados de la búsqueda de Google. Si no puedes esperar, ya se escribió mucho contenido sobre la eliminación de URLs y la solución de problemas individuales en nuestro Foro de ayuda. Si todavía tienes preguntas después de leer las experiencias de los demás, puedes preguntar. Ten en cuenta que, en la mayoría de los casos, es difícil brindar asesoramiento relevante sobre una eliminación en particular sin conocer el sitio o la URL en cuestión. Te recomendamos que compartas tu URL con un servicio de acortamiento de URL para que la URL que te preocupa no se indexe como parte de tu publicación. Algunos servicios de acortamiento incluso te permitirán inhabilitar el acceso directo más adelante, una vez que se haya resuelto tu pregunta.

Por último, es posible que también te interese leer cómo administrar la información disponible en Internet sobre ti.