Evitar que en la Búsqueda de Google se muestre información oculta
Al publicar documentos e imágenes en la Web, puede que, sin darte cuenta, incluyas información que no se ve a simple vista. Por ejemplo, puede haber información que no veas o que debería estar oculta en algunos formatos de documento, pero que algunos buscadores pueden ver.
Dado que los buscadores indexan material público de la Web, imágenes incluidas, es posible encontrar cualquier contenido que no se haya ocultado por completo. Las tecnologías asistenciales, como los lectores de pantalla, permiten acceder más fácilmente a este tipo de contenido; además, con las técnicas más habituales de comprensión de imágenes, como el reconocimiento óptico de caracteres (OCR), puedes buscar este tipo de contenido oculto de forma similar.
Aunque algunos métodos oculten el contenido a simple vista, ya sea incluyendo texto en una fuente muy pequeña, utilizando un color de fuente igual al de su fondo o colocando una imagen sobre un texto, los buscadores pueden indexar ese contenido y mostrarlo en sus resultados, ya que estos métodos no ocultan realmente el material.
Del mismo modo, algunos tipos de documentos contienen información que no se puede ver a simple vista. Por ejemplo, ciertos archivos incluyen el historial de cambios, por lo que los usuarios podrían ver texto que se ha ocultado o modificado. Otros archivos pueden conservar las versiones completas de imágenes que se han editado para quitar u ocultar información. Además, en un archivo puede haber metadatos que, aunque no se vean, pueden contener los nombres de las personas que lo han editado o consultado.
Toda esta información sigue ahí aunque se exporte un documento o se cambie a otro formato. Si quieres quitar información de un archivo, es fundamental retirarla por completo antes de publicarlo.
En este artículo, se indican algunas prácticas recomendadas sobre cómo ocultar correctamente información incluida en documentos si no quieres que se indexe ni que se pueda encontrar a través de la Búsqueda de Google.
Editar y exportar imágenes antes de insertarlas
La Búsqueda de Google muestra imágenes que encuentra en la Web, incluidas las que aparecen en páginas web y las que están insertadas en determinados formatos de documentos. En ocasiones, las imágenes insertadas se editan solo mediante las herramientas de edición del documento que las contiene. Así pues, es posible que la imagen no se pueda ocultar si se indexa de manera independiente al documento. Por este motivo, es mejor editar las imágenes antes de insertarlas en un documento, no después. En términos generales:
- Recorta la información no deseada de las imágenes antes de insertarlas en los documentos. Algunas herramientas de edición de documentos, como los procesadores de texto o las herramientas de creación de diapositivas, conservarán las imágenes sin recortar que utilices en la versión pública de los documentos, así que consulta detenidamente la documentación de la herramienta que vayas a utilizar.
- Borra u oculta por completo cualquier texto o elemento de las imágenes que no quieras que se publique, ya que los sistemas de OCR pueden convertir cualquier texto de imagen en texto visible para buscadores.
- Retira los metadatos que no quieras.
Una vez que hayas seguido los consejos de este documento, exporta o guarda las imágenes actualizadas como formatos de archivo de imagen no vectoriales o comprimidos, como PNG o WEBP. De este modo, esas partes de las imágenes no se incluirán por error en documentos públicos.
Editar o quitar texto no deseado antes de pasarlo a un formato de archivo público
Antes de generar un documento público, borra todo el texto que no quieras que se muestre en la versión final del archivo. Pasa el documento a un formato público que no conserve el historial de cambios. A continuación, te indicamos más consejos específicos:
- Si quieres ocultar información en un documento, utiliza las herramientas de ocultación de contenido adecuadas. Por ejemplo, no coloques rectángulos negros sobre el texto para ocultarlo, porque el texto seguirá incluido en el documento público.
- Comprueba bien los metadatos del documento en el archivo público.
- Sigue las prácticas recomendadas para ocultar información de documentos del formato que utilices (PDF, imagen, etc.).
- Ten en cuenta la información incluida en la URL o en el propio nombre del archivo. Aunque parte de un sitio web esté bloqueado por un archivo robots.txt, las URL se pueden indexar en la búsqueda, aunque no se incluya su contenido. Incluye hashes en los parámetros de URL y no direcciones de correo ni nombres.
-
Añade métodos de autenticación para limitar el acceso al contenido ocultado. Publica la página de inicio de sesión resultante con una etiqueta
meta
robotsnoindex
para bloquear la indexación. - Al publicar, comprueba que el sitio web esté verificado en Google Search Console. De este modo, podrás retirar contenido rápidamente si es necesario.
Qué hacer si los documentos que no se han ocultado o que no se han ocultado correctamente se indexan en la Búsqueda
- Quita el documento del sitio web o de la ubicación donde lo hayas publicado.
- Usa la herramienta de retirada para retirar de la Búsqueda los documentos en cuestión del sitio verificado. Si vas a seguir este proceso con muchos documentos, usa un prefijo de URL. En los sitios verificados, la retirada de URLs suele tardar menos de un día. De ese modo, se evita que el documento en cuestión aparezca en las búsquedas de contenido oculto.
- Aloja el documento correctamente ocultado en otra URL. De este modo, cualquier versión que se indexe será del nuevo documento y no de una versión anterior, ya que rastrear de nuevo URLs y actualizarlas en un índice de búsqueda puede llevar un tiempo. Actualiza los enlaces que lleven a esos documentos.
- Ponte en contacto con los administradores de los sitios donde es posible que estén alojados los documentos mal ocultados y pídeles que los eliminen con la herramienta de retirada de su cuenta de Search Console. También puedes usar la herramienta Retirar contenido obsoleto para solicitar a los sistemas de Google que actualicen los resultados de búsqueda.
- Espera a que caduquen las solicitudes de retirada de URLs, lo que sucederá una vez que las URL se hayan actualizado en el índice de la Búsqueda de Google o tras unos 6 meses.