Saltar al contenido principal




El comando “noindex” se sitúa en las metaetiquetas para informar a los rastreadores de los motores de búsqueda que la página visitada no debe ser indexada. Los webmasters disponen con esta función la oportunidad de manipular el procedimiento de indexación de sus páginas.

Implementación

La metaetiqueta “noindex” se incorpora en el código fuente de un portal web al final del <head> y en la zona de los Metadatos. Aparece del siguiente modo:

<Meta name = “robots” content = “noindex” />

El contenido de esta página no será indexado y de esta manera no se mostrará en los SERPs.

600x400-noindex-es-01.png

Para comprobar si la metaetiqueta ha sido leída correctamente por los rastreadores los webmaster pueden llevar adelante el Comando de Búsqueda site: para esa página en los motores de búsqueda. Si se ha hecho correctamente la página no debería aparecer en los resultados, SERPs.

Apps

Con el comando “noindex” los motores de búsqueda excluyen las páginas indicadas y no guardan su información en la base de datos. Esto resulta muy útil para, por ejemplo:

  • Resultados de búsqueda internos
  • Contenido / páginas duplicadas
  • Contenido copyright

Las páginas marcadas por el «noindex» se encuentran en el “Deep Web”.

Noindex vs. disallow

En muchos casos los webmasters no disponen claro cuál es la diferencia entre los comandos «disallow» del archivo Robots.txt y la metaetiqueta «noindex». Generalmente hablando no se recomienda usar los dos comandos simultáneamente.

La diferencia es simplemente que con el comando «disallow» los motores de búsqueda no disponen permitido tener acceso a la URL y con el comando «noindex», estos pueden tener acceso pero los rastreadores no pueden indexar la página.

Disallow

El contenido no debería ser analizado como:

  • Contenido sensible como datos de registro
  • Para volúmenes de datos muy elevados, base de datos de imágenes

A pesar de todo, es viable que la página sea indexada.

Noindex

  • El contenido puede analizarse pero no indexarse
  • Resultados de búsqueda internos
  • No entra en el index

“noindex,follow”

Si lo que se pretende es que un dominio no sea indexado pero que el link sí que sea rastreado, se debe usar la metaetiqueta “noindex”,“follow”:

<Meta name = "robots" content = "noindex, follow" />

Este comando resulta útil para las categorías que contienen muchísimas páginas. El robot puede ingresar en el link pero puede indexar solo la primera página de cada categoría, por ejemplo.

Relevancia para el SEO

La metaetiqueta ‘“noindex”’ es una herramienta de SEO muy útil para evitar que el contenido duplicado sea indexado y, de esta manera, para evitar posibles penalizaciones y consecuente deterioro del posicionamiento. Al mismo tiempo, al añadir el comando “follow” los rastredaores disponen la oportunidad de seguir pero no de indexar las páginas.

Muchos CMS (Sistemas Gestores de Contenidos) crean muchas páginas de forma automática para que sean indexadas rápidamente. En casos extremos este aumento de páginas se considera una técnica spam pero con el comando “noindex” se puede evitar ser penalizado.

Cuando se lleva a cabo el relanzamiento de un portal web el comando “noindex” facilita el trabajo: mientras se comprueba la funcionalidad del nuevo sitio se bloquea su indexación para no crear contenido duplicado.

Enlaces web

R Marketing Digital