La etiqueta canonical, conocida en inglés como Canonical Tag, se sitúa en el código fuente de un portal web y apunta a las URLs canónicas que muestran el mismo contenido, o contenido muy equivalente. Si se indica cuál es la URL canónica correctamente, esta será utilizada para la indexación de los motores de búsqueda.
Los buscadores puntúan negativamente a los sitios web que presentan contenido duplicado porque no ofrecen valor añadido para los usuarios. Se recomienda usar la etiqueta canonical para no ser penalizados por contenido duplicado y utilizar herramientas como, por ejemplo, el Duplicate Content Checker que te ayuda a reconocer este tipo de contenido.
Usos
La etiqueta canonical se usa cuando existe contenido duplicado o cuando hay muchas URLs distintas mediante de las cuales se accede a la misma página.
Ejemplo
Cuando se accede a la página inicial mediante de distintas URLs (www.domain.com, domain.com, www.domain.com/index.html, etc.). Se pueden hallar dominios con o sin Barras y con sensibilidad a las mayúsculas. El servidor solo se fija en una dirección IP pero admite variaciones como, por ejemplo, sesiones distintos o filtros de producto.
Al mismo tiempo, el mismo contenido puede estar presente en distintas versiones (E.g. versión de imprenta, PDF, etc.) y publicarse en diversos sitios web externos.
Por este motivo se recomienda incluir la etiqueta canonical en todas y cada una de las páginas para que todos los hipervínculos sean redireccionados correspondientemente y, puedan evitarse posibles imprevistos e hipervínculos erróneos.
Tipos de URLs canónicas
Hay dos tipos de URL canónica pero Google recomienda usar las URLs absolutas, es decir, la dirección completa del portal web.
En esta circunstancia la sintaxis es la próxima:
<enlace rel=”canonical” href=”http://www.example.com/examplepage.htm”/>
El elemento <enlace/> contiene el atributo canónico y se sitúa en el elemento <head/> del código fuente. Forma parte de los metadatos del documento y hace referencia a la página estándar. Se usa solamente en las páginas que presentan un contenido semejante al de la página estándar/original.
Ejemplos
http://www.example.com/examplepage.htm http://www.example.com/examplepage/?session_id=xyz.htm
La primera es nuestra fuente estándar. La segunda es una sesión utilizada generalmente en tiendas online en la que se almacena información relativa a sus usuarios (E.g los productos seleccionados en el carrito de la compra). En esta circunstancia, la etiqueta canonical debe integrarse en el elemento de cabecera de nuestro segundo ejemplo.
Si la URL estándar es un documento PDF o cualquier otro tipo de documento compatible con Google, la etiqueta canonical se sitúa en la cabecera del portal web. La sintaxis es distinto y la incorporación requiere conocimientos de lenguaje hipertexto (HTTP – Hypertext Transfer Protocol):
<http://www.example.com/examplepage.pdf>; rel=”canonical”
Resumiendo
La etiqueta canonical representa una advertencia. Es decir, si el usuario (E.g. navegador o motor de búsqueda) manda una solicitud, el servidor responde especificando que es una URL canónica. Atención: a veces el servidor debe ser reconfigurado.
Veamos ahora las siguientes dos URLs:
http://www.example.com/examplepage.htm http://www.example.com/examplepage.pdf
En esta circunstancia, la segunda web es la que debería considerarse como fuente estándar . Al ser un documento PDF, la etiqueta canonical se sitúa en la cabecera del portal web e indica a Google que este documento PDF es el estándar para la indexación.
Origen
Con la ayuda de la etiqueta canonical el webmaster es capaz de comunicarle a los motores de búsqueda qué portal web debe ser tratado como la fuente estándar y mantener bajo control el contenido duplicado. Por esto, la etiqueta canonical es una herramienta muy importante para la optimización de un portal web en los motores de búsqueda.
Errores frecuentes
Esta herramienta es muy potente y si no se utiliza correctamente el portal web podría pasar desapercibido por Google. Para comenzar, y lo más importante, el webmaster debe cerciorarse de que sencillamente el contenido sea semejante, o casi semejante, porque solo en estos casos tiene sentido usar esta etiqueta.
Ejemplos
Con páginas numeradas con los parámetros rel=”next” y rel=”prev” , no tiene sentido usar las etiquetas canonical dado que, desde el punto de vista técnico, no se considera contenido semejante. Al mismo tiempo, el portal web debe ser alcanzable: el código de error A 404 debe evitarse. Usar las etiquetas Noindex, “disallow” o “nofollow” en combinación con URLs canónicas está penalizado por Google. La etiqueta canonical no debe encontrarse en el cuerpo, body, de un documento y no debe utilizarse repetidamente en los metadatos.
Enlaces Web
- 5 errores comunes con rel = canonical googlewebmaster-es.blogspot.de