L'URL canonique (balise "link rel=canonical") pour éviter le duplicate content

Qu’est ce qu’une balise link rel=canonical ?

La balise link rel=canonical est une balise HTML qui permet d'indiquer aux moteurs de recherche l'URL canonique sur une page donnée. Voir le paragraphe suivant pour comprendre ce qu'est une URL canonique.

Celle balise doit être placée dans la zone <head> d'un fichier HTML :

<head>
...
<link rel="canonical" href="http://www.yakaferci.com/" />
...
</head>

Plusieurs terminologies en anglais désignent la balise link canonical : « canonical tag », « rel=canonical », « rel canonical tag », « canonical URL tag » , « link canonical tag ».

En français on retrouve « balise link rel=canonical », « balise canonique », « URL canonique »

Qu’est-ce qu’une URL canonique ?

Une URL canonique correspond à la version préférée d'un ensemble de pages au contenu similaire pouvant créer des cas de contenus dupliqués (duplicate content). L'URL canonique doit être choisie avec soin par le Webmaster du site concerné.

L'ajout de la balise canonique permet aux propriétaires de sites d'identifier les ensembles de contenu identiques et d'indiquer à Google : "Parmi toutes ces pages dont le contenu est très similaire, merci de ne prendre en compte dans les résultats de recherche que cette URL canonique".

Un pratique les URLs dont le code HTML indique une autre URL canonique via cette balise n'apparaitront jamais dans les résultats de recherche de Google. C'est toujours l'URL canonique qui sera retenue par les moteurs de recherche.

L’URL canonique permet donc d’éviter les cas de contenu dupliqués (duplicate content)

Consultez l'article dédié au duplicate content pour plus d'informations sur ce sujet.

Consultez l'article dédié aux URLs (Uniform Resource Locator) pour plus d'informations sur ce sujet.

Objectifs de la balise « link rel=canonical »

L’utilisation de l’élément « link rel=canonical » a 3 objectifs qui sont très importants pour l’optimisation du SEO :

  • La balise canonique permet d’aider les moteurs de recherche à identifier facilement et rapidement quelle page inclure ou exclure de leur indexation et avant tout quelle version d’URL remonter dans les requêtes de recherche.
  • La balise « link rel=canonical » permet d’éviter d’éventuelles pénalités SEO liées à des contenus dupliqués très souvent générés automatiquement par le CMS utilisé.
  • La balise « link rel=canonical » permet d’augmenter la popularité d’un contenu en mutualisant sur une URL unique les backlinks. Il arrive que plusieurs backlinks pointent vers un même contenu, mais que les liens permettant d’accéder au contenu varient en fonction par exemple des paramètres de tri qu’ils contiennent.

Comment mettre en place la balise « link rel=canonical » ?

Balisage des pages avec « link rel=canonical »

Parmi deux ou plusieurs pages très similaires, il est conseillé d’indiquer celle qui est votre favorite, c'est à dire celle que vous souhaitez faire analyser et indexer par les moteurs de recherche.

Pour cela vous pouvez utiliser l’élément « link rel=canonical ». Dans les pages similaires ou secondaires, il faut ajouter un élément « link rel=canonical » dans le <head> de la page.

<head>
...
<link rel="canonical" href="http://www.yakaferci.com/" />
...
</head>

Un sitemap pour indiquer les URLs favorites portant la balise « link rel=canonical »

Afin d’accélérer l’exploration de votre site par les moteurs de recherche et vous assurer que vos URLs canoniques seront bien prises en compte, il est souvent conseillé de créer un sitemap. Sélectionnez vos URLs canoniques pour chacune de vos pages et indiquez dans le sitemap que vous soumettrez aux moteurs de recherche.

Les URLs secondaires ne devront évidemment pas être listées dans le sitemap.

Comment savoir s’il faut utiliser la balise link canonical ?

Il est conseillé d’utiliser la balise link canonical dans le cas où votre site contient deux ou plusieurs URLs différentes proposant un contenu identique.

Si le contenu de deux pages est assez proche mais pas complètement identique alors il serait plus judicieux d’un point de vue offre et d’un point de vue SEO de retravailler les pages afin de les rendre différentes.

Pour savoir si deux ou plusieurs pages sont similaires, il existe deux méthodes de vérification très simples :

  • Placer les deux pages côte à côte et vérifier si la plupart des phrases se retrouvent sur les deux pages. Si oui alors vous avez deux contenus dupliqués.
  • Analyser vos pages « suspectes » sur notre outil Yakaferci. Dans le chapitre contenu / densité de mots clés, vérifiez si vous avez la même liste de mots avec les mêmes variantes (lemmatisation) et la même occurrence.

Cas d’utilisation de la balise link canonical :

La balise link canonical est une solution rapide et saine permettant de résoudre les cas de contenus dupliqués constatés sur votre site.

Cas 1 : Urls dynamiques générées par la fonction de tri de produit

Pour illustrer le concept d'URL canonique, imaginez que l'URL /tous-lesproduits.html d'un site contienne la liste intégrale de tous les produits d'un site e-commerce, par ordre alphabétique. Et que si l'utilisateur clique sur le tri par ordre décroissant, l'URL utilisée par le développeur du site soit /tous-lesproduits.html?tri=Z-A. Dans ce cas, les 2 URLs contiennent le même contenu mais dans des ordres différents. C'est typiquement un cas ou il est recommandé d'indiquer à Google une "URL canonique" pour que seule celle-ci soit indexée :

Link canonical

Cas 2 : CMS générant des URLs différentes

Votre système de gestion du site (CMS) génère des URLs différentes à chaque fois que vous placez un produit sous plusieurs catégories ou sous-catégories

Là encore pour éviter des problèmes de contenus dupliqués il est conseillé de définir une URL favorite.

URL avec contenu identique

Solution : définir une URL favorite

URL avec contenu identique Solution : définir une url favorite
http://www.monsite.com/catégorie-rouge/01-produit http://www.monsite.com/nouvautés/01-produit
http://www.monsite.com/nouvautés/01-produit
http://www.monsite.com/meilleures-ventes/01-produit

Quelles sont les erreurs à éviter ?

Voici une liste non exhaustive d’erreurs de mise en place de la balise « link rel=canonical » constatées sur les site web :

  • la balise « canonical » placée dans le body et non dans le <head> du code HTML des pages du site (page canonique et pages en duplicate content)
  • Pour que la règle que vous souhaitez mettre en place soit rapidement et efficacement prise en compte il faut placer la balise « link rel=canonical » dans le head. De cette manière les moteurs dès le chargement de la page sont mis au courant.
  • L’écriture des URLs (relatives ou absolues) dans la balise la balise link canonical : Il est conseillé d’utiliser des chemins d’accès absolus (http://www.monsite.com/01-produit) plutôt que des chemins d’accès relatifs (/01-produit ) Cela permet d’indiquer avec précision les pages concernées par la règle et évite de confondre certaines pages.
  • Insérer la balise canonical dans les contenus paginés si le contenu des pages est différent. Si vous proposez 200 articles différents dans une catégorie donnée, et que vous ne présentez que 50 articles par page, vous utilisez souvent un système de pagination (page 2, page 3, page 4) pour présenter tous vos articles. Il ne faut pas mettre en place la balise link reel=canonical pour indiquer que la page 1 est votre favorite car les autres pages (page 2, page 3 et page 4) contenant des articles différents ne seront pas indexé ce qui est dommage pour le SEO.
  • Spécifier différentes URL canoniques pour la même page. Cela va créer une confusion entre des règles contradictoires. Une même page ne peut être désignée canonical qu’une seule fois.
  • L'URL canonique renvoie une erreur 404. Si l'URL canonical renvoie une erreur 404, et les pages secondaires sont « interdites » à l’indexation par la balise link rel=canonical alors votre contenu disparaît définitivement des résultats de recherche.
  • La page favorite ne doit pas contenir de balise meta robots « noindex » ou être interdite dans le fichier robots.txt. Le robots.txt est prioritaire à la balise meta robots «noindex » qui est à son tour prioritaire à la balise link rel=canonical. Si le robots.txt ou la balise meta robots « noindex » interdisent une page canonical à l’indexation et qu’en même temps toutes pages secondaires (à la page canonical) sont à leur tour interdites par la balise link rel=canonical alors 100% du contenu sera définitivement retiré de l’index des moteurs de recherche.
  • La page favorite et les pages secondaires ne doivent pas contenir d’autres balises link canonical. Plusieurs pages contenant des balises link canonical renverraient des messages contradictoires ce qui n’aidera pas les moteurs de recherche et annulerait l’effet de ces balises canonical.
  • La mauvaise page marquée comme étant la page canonical.

Différence entre l’URL canonical et une redirection 301

D’un point de SEO, l’URL canonical et la redirection 301 renvoient un message très proche aux moteurs de recherche :« mon site contient plusieurs pages contenant des contenus des similaires et qui peuvent être « regroupées » sous une seule »

Cependant il existe des différences importances entre une URL canonical et une redirection 301 :

la redirection 301 renvoie 100% du trafic provenant des internautes et des moteurs vers l’URL unique alors que l’URL canonical n’est destiné qu’aux moteurs. Les URLs secondaires sont utiles au fonctionnement du site pour le visiteur (par exemple un tri) mais pas pour les moteurs de recherche.

Consultez l'article dédié aux Redirections 301 pour plus d'informations sur ce sujet.