Bloquea la indexación de búsqueda con noindex

noindex es una regla establecida con una etiqueta <meta> o un encabezado de respuesta HTTP que se usa para evitar la indexación de contenido por parte de motores de búsqueda que admiten la regla noindex, como Google. Cuando Googlebot rastree esa página y obtenga la etiqueta o el encabezado, Google descartará la página por completo de los resultados de la Búsqueda de Google, independientemente de que otros sitios dirijan a ella.

noindex es útil si no tienes acceso con permisos de administrador a tu servidor, ya que te permite controlar el acceso a tu sitio página por página.

Cómo implementar noindex

Hay dos maneras de implementar noindex: como etiqueta <meta> y como encabezado de respuesta HTTP. Ambos métodos tienen el mismo efecto, así que elige el que te resulte más conveniente y adecuado para el tipo de contenido. Google no admite la especificación de la regla noindex en el archivo robots.txt.

También puedes combinar la regla noindex con otras reglas que controlen la indexación. Por ejemplo, puedes unirte a un atributo nofollow con una regla noindex: <meta name="robots" content="noindex, nofollow" />.

Etiqueta <meta>

Para evitar que todos los motores de búsqueda que admiten la regla noindex indexen una página de tu sitio, coloca la siguiente etiqueta <meta> en la sección <head> de su página:

<meta name="robots" content="noindex">

Para evitar que solo los rastreadores web de Google indexen una página, coloca la siguiente metaetiqueta:

<meta name="googlebot" content="noindex">

Ten en cuenta que algunos motores de búsqueda pueden interpretar la regla noindex de manera diferente. Por eso, es posible que tu página continúe apareciendo en los resultados de otros motores de búsqueda.

Obtén más información sobre la etiqueta noindex <meta>.

Encabezado de respuesta HTTP

En lugar de una etiqueta <meta>, puedes mostrar un encabezado HTTP X-Robots-Tag con un valor de noindex o none en tu respuesta. Un encabezado de respuesta se puede usar para recursos que no sean HTML, como archivos PDF, de video o de imágenes. A continuación, se incluye un ejemplo de una respuesta HTTP con un encabezado X-Robots-Tag que indica a los motores de búsqueda que no indexen una página:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Obtén más información sobre el encabezado de respuesta noindex.

Cómo depurar errores noindex

Debemos rastrear tu página a fin de ver las etiquetas <meta> y los encabezados HTTP. Si una página sigue apareciendo en los resultados, es probable que se deba a que no la hayamos rastreado desde que agregaste la regla noindex. Según la importancia de la página en Internet, es posible que Googlebot tarde meses en volver a visitarla. Puedes solicitar que Google vuelva a rastrear tu página con la Herramienta de inspección de URLs.

Si necesitas quitar rápidamente una página de tu sitio de los resultados de la Búsqueda de Google, consulta nuestra documentación sobre eliminaciones.

Otro motivo podría ser que el archivo robots.txt esté bloqueando la URL para los rastreadores web de Google, por lo que estos no pueden ver la etiqueta. Para desbloquear tu página para Google, debes editar el archivo robots.txt.

Por último, asegúrate de que Googlebot pueda ver la regla noindex. Para probar si tu implementación de noindex es correcta, usa la Herramienta de inspección de URLs para ver el código HTML que recibió Googlebot durante el rastreo de la página. También puedes usar el Informe de indexación de páginas de Search Console para supervisar las páginas en tu sitio de las que Googlebot extrajo una regla noindex.