Le cauchemar de tout responsable SEO : le duplicate content !
Comment utiliser la balise canonical ? Vous vous dites certainement : encore une question technique et chronophage de plus…
Mais ne passez pas votre chemin trop vite, et regardez plutôt les embûches qu’un bon usage de la balise canonical pourrait vous éviter.
Vous travaillez quotidiennement avec des enjeux SEO, pour votre propre site ou pour un client ? Alors, vous savez mieux que quiconque que le cauchemar de tout responsable SEO est le duplicate content ! La balise canonical permet justement de l’éviter.
Alors, lorsqu’il s’agit de rédiger et intégrer votre contenu efficacement, vous devez utiliser la balise canonical.
Loin d’être une nouveauté, il est étonnant de voir des sites avec beaucoup de contenu ne pas l’exploiter au grand dam des responsables digitaux.
Revenons sur la présentation de cette balise canonical et voyons comment l’utiliser à bon escient dans vos sites et ainsi améliorer considérablement votre compatibilité SEO avec les moteurs de recherche.
La balise canonical : définition
La balise canonical fait partie intégrante du langage HTML, qui permet un repérage rapide et conventionnel de la structure de votre site, aussi bien par les développeurs que plus tard par les robots d’indexation Google. Sa codification agit au même titre que les balises Hn, ou encore les balises « title » ou « métadescription ».
Pourtant, nombre de sites font l’impasse sur cette balise canonical, car elle peut sembler à tort moins fondamentale pour le SEO que, par exemple, la métadescription dont on sait qu’elle conditionne directement la décision de l’internaute qui va cliquer ou pas sur votre site apparu dans sa page de résultats de recherche.
Mais à quoi sert au juste la balise canonical ?
La balise canonical est un tag ajouté dans votre code HTML pour déterminer la version principale de votre page et la différencier du :
- Contenu dupliqué
- Contenu proche
- Pages similaires
Si vous disposez d’un contenu proche ou similaire sur plusieurs de vos pages, vous pouvez indiquer la page mère la plus importante en lui associant cette balise canonical.
Ainsi, les développeurs ayant accès au code source d’une part, les robots d’indexation des moteurs de recherche d’autre part, sauront déterminer sans aucune ambiguïté laquelle de vos pages est la page originelle.
Quel est le rôle de la balise canonical en SEO ?
Le rôle majeur des balises canonical est d’éviter que Google ne détecte du contenu dupliqué. C’est une des très mauvaises pratiques en SEO qui pourrait vous coûter cher dans les classements.
En effet, le « duplicate content » est une pratique considérée comme frauduleuse par l’algorithme de Google : elle est sanctionnée en conséquence, en « plombant » significativement la position du site en question dans les résultats de recherche.
De plus, le crawling de pages similaires consomme votre « budget de crawl », c’est-à-dire le temps que passe les robots de Google à auditer votre contenu.
S’ils doivent revenir sur plusieurs pages similaires, ils ne pourront peut-être pas prendre en compte de nouveaux contenus pour lesquels vous aimeriez apparaitre dans les SERPs.
Le « duplicate content » constitue donc une double peine pour votre site puisqu’il laisse dans l’ombre des parties intéressantes, mais non crawlées par manque de temps. Un bon usage de la balise canonical est par conséquent crucial pour optimiser votre crawling.
En outre, une relecture de votre site à la recherche du contenu dupliqué à éradiquer peut être très bénéfique aussi pour améliorer l’expérience utilisateur : si relire deux fois la même chose est sanctionné par les spybots de Google, c’est aussi désagréable pour vos prospects qui parcourent votre site.
Pour éviter cet effet « galerie des glaces », où chaque page profonde peut sembler le reflet exact de la précédente en raison du duplicate content, il est donc intéressant de se mettre à la fois à la place des robots d’indexation et de vos clients potentiels pour optimiser votre site.
Vous pensez ne pas avoir de duplicate content dans votre site ?
Regardez de plus près. Surtout en e-commerce avec les multitudes de déclinaisons produits : il faut compter avec les déclinaisons en termes de tailles, de couleur, de pointure, voire parfois de matière de composition ou de qualité de finition.
Il est alors quasi inévitable de se répéter de nombreuses fois, à moins d’avoir recours à un rédacteur qualifié, rompu à l’exercice de la reformulation originale.
Retenez que Google scanne des URLs.
Celle d’un produit pourrait être :
- https ://votresitecommerce.com/fr/chemises/ete/.html
Puis en filtrant avec vos critères vous allez générer plusieurs URLs pour ce même produit :
- https ://votresitecommerce.com/fr/chemises/ete/.html ?size=M
- https ://votresitecommerce.com/fr/chemises/ete/.html ?size=M&color=pink
Suivez la logique des URLs ?
Pour un même produit, vous pouvez avoir au moins 10 URLs et le contenu relatif à ces pages est nécessairement proche donc facilement classifié comme du contenu dupliqué.
Grâce à la balise canonical spécifiant la page principale de votre produit, vous pouvez vous prémunir d’une erreur de jugement des robots de Google.
Comment implémenter la balise canonical ?
Sachez que vu son utilité, certains systèmes de gestion de contenu, comme le célèbre WordPress, propose la balise canonical, soit automatiquement, soit via une extension facile d’utilisation.
1. Où placer votre balise ?
Placez votre balise canonical dans la partie < head > de votre code. La balise prend la forme suivante :
< link rel=«canonical» href=« https ://votresite.com/page-exemple/» / >
Ce tag doit être mis non pas sur la page principale, mais sur toutes les pages de contenu dupliqué. Ainsi, les robots ne perdront pas de temps à les auditer et se rendront directement sur la page mère indiquée.
Vous épargnez donc votre « budget crawl », pour laisser le temps aux robots d’indexation d’auditer d’autres pages de votre site.
2. Utilisez des URLs absolues
Pour taguer vos URLs avec la balise rel=« canonical », utilisez toujours des URLs absolues, c’est-à-dire l’ensemble de votre lien profond incluant les catégories s’il y en a.
Exemple :
< link rel =«canonical» href= « https ://votresite.com/page-exemple/» />
au lieu de :
< link rel =«canonical» href= « /page-exemple/» />
3. Une seule balise canonical par page
Si une page a plusieurs tags canonical, alors Google n’en référencera aucune.
4. Optimisez votre sitemap
Seules les pages taguées canonical doivent être placées dans votre sitemap.
Après avoir déterminé vos pages et implémenté vos tags, pensez donc à mettre à jour vos URLs dans votre sitemap.
De même qu’on a vu précédemment que la traque du duplicate content pouvait aussi améliorer l’expérience utilisateur, on voit à présent que l’usage de la balise canonical a un effet bénéfique sur votre sitemap.
Or, on sait qu’un sitemap bien structuré et mis à jour est une garantie que les moteurs de recherche soient bien informés des différentes adresses des pages d’un site.
Les erreurs à éviter avec les balises canonicals
Parmi les erreurs courantes que l’on constate en SEO, voici une sélection des mauvais usages les plus casse-tête que vous pourriez rencontrer en utilisant la balise canonical :
- Placer à la fois un tag rel=canonical et noindex. Il s’agit d’un pléonasme en SEO, car vous indiquez plusieurs fois la même chose : la non-prise en compte de la page dans le crawling. Cela crée une injonction contradictoire pour le robot d’indexation, et signale pour vous que votre vision de la structure de votre site doit encore gagner en précision.
- Dans ce cas, priorisez la balise canonical pour réorienter le trafic vers votre page maîtresse, tout en indexant votre plage dupliquée.
- Utiliser la balise canonical pour spécifier une page de langue différente. Si votre site est multilingue, vous devez certainement utiliser une balise Hreflang.
- Dans ce cas, il est d’usage de préciser une page canonical dans le même langage que les pages dupliquées, ou bien dans une langue universelle si cette page n’existe pas dans le même langage.
Les balises « canonical » sont un moyen simple d’éviter le duplicate content en SEO.
Lorsque votre site dispose d’un contenu important avec des déclinaisons multiples, il est essentiel de déterminer celles que vous souhaitez mettre en avant vis-à-vis des moteurs de recherche.
Plutôt que de voir ce travail sur la balise canonical comme une contrainte supplémentaire, en termes de temps et de délai, faites de ce passage obligé une occasion d’améliorer l’ensemble de votre site et de son rayonnement, tant au niveau de votre lectorat que des robots d’indexation.
En effet, faire l’impasse sur ce travail de la balise canonical serait un gain illusoire à court terme en termes de temps et d’argent : une pénalisation pour duplicate content pénaliserait tout le travail SEO réalisé patiemment en amont pour valoriser votre site.
D’un autre côté, on comprend qu’envisager isolément cet enième travail supplémentaire peut sembler difficile quand les délais et les budgets sont serrés.
Il existe une voie médiane et féconde, qui consiste à intégrer pleinement ce travail sur la balise canonical dans le processus global de création de contenu, de développement du site et enfin de veille SEO et expérience utilisateur. Car même si ces postes requièrent des compétences différentes, ils sont interdépendants et peuvent s’apporter beaucoup les uns aux autres.
C’est pourquoi prendre le temps d’une vision globale intégrant tous les aspects du processus est crucial pour optimiser le travail de chacun.
En effet, un travail bien effectué sur la balise canonical inaugure un cercle vertueux à plusieurs niveaux : il clarifie le sitemap qui à son tour vous favorise auprès de Google, il donne une vision claire de l’architecture du site et permet donc d’envisager des améliorations, il traque le duplicate content pour une expérience utilisateur exclusive et agréable.