Pourquoi devez-vous éviter à tout prix le duplicate content ?

Duplicate content : pourquoi l'éviter à tout prix

Il existe 1001 manières de rendre votre site internet mal référencé. Le duplicate content est l’une des plus courantes. Pourtant, ce qui est intéressant pour vous, c’est que les efforts à réaliser et les stratégies à mettre en place pour en éviter les conséquences vont vous faire passer devant tous vos concurrents !

Qu’est ce que le duplicate content ?

La notion de « duplicate content » est très facile à comprendre, y compris pour un non initié au référencement naturel. Je reprendrai la définition du site MOZ (https://moz.com/learn/seo/duplicate-content) qui a le mérite d’être limpide : « Un contenu dupliqué est un texte qui apparait sur internet à plusieurs endroits ». Tout simplement. On considère que le contenu dupliqué représente environ 29 % des contenus diffusés sur le web (https://raventools.com/blog/duplicate-content/).

Voici trois exemples pour illustrer cette définition.

Supposons que vous avez un e-commerce où vous vendez des télévisions Samsung. Vous créez autant de fiches que de références, mais par manque de temps (d’envie ou de moyens…), vous choisissez de ne pas rédiger vous-même le descriptif de chaque modèle. Vous reprenez donc tout simplement le contenu des fiches sur le site officiel de Samsung. Légalement, vous avez le droit puisque vous êtes un revendeur de la marque. Reste que, dans ce cas, Google considérera vos fiches produits comme du contenu dupliqué, une vulgaire copie de l’original, et, par conséquent, ne les affichera pas dans les résultats.

Restons toujours dans le e-commerce. Imaginons que vous vendez une enceinte Bluetooth qui existe dans 5 teintes différentes. Chaque couleur ayant une référence différente vous avez fait le choix de faire 5 fiches indépendantes, mais au contenu identique. Encore une fois, Google estimera que sur vos 5 fiches, 4 sont du contenu dupliqué. Ces dernières seront certainement supprimées des résultats.

Vous pouvez également ne créer qu’une seule page et utiliser les options de variations que vous propose votre boutique. En règle générale, celle-ci va générer plusieurs variantes de votre fiche produit qui se distingueront simplement par des URL légèrement différentes. Pour vous, il n’y aura qu’une page, mais pour Google il y aura autant de pages aux contenus identiques que de variations !

Un dernier exemple, plus technique. Votre serveur est (très) mal paramétré.

Imaginez que l’adresse de votre site est : www.nomdevotreboutique.com. Il y a quelques années, une agence vous a convaincu de l’urgence de passer en « https » (et vous a d’ailleurs pris une fortune pour le faire…), mais elle n’a pas bien configuré les redirections.

Il s’avère que votre site en version non sécurisé (http://www.nomdevotreboutique.com) est accessible et ne renvoie pas automatiquement vers la version en https. Google peut alors y voir non pas un, mais deux sites… totalement identiques ! Ce peut être aussi la même chose entre les versions avec ou sans « www ».

Les causes provoquant du contenu dupliqué sont nombreuses. Elles peuvent être à la fois techniques ou volontaires.

Maintenant, prenons le temps d’analyser les conséquences du duplicate content sur votre référencement.

Les conséquences du duplicate content sur votre référencement

Google considère, à juste titre, que la majorité des contenus dupliqués ne sont pas « trompeurs ». Autrement dit, ils sont souvent le résultat d’une non-maîtrise ou un mauvais paramétrage des CMS plutôt que d’une volonté affirmée de tromper le moteur de recherche en affichant des contenus de qualité volés sur un site de référence.

Cela signifie donc que Google ne pénalise pas à proprement parler une page internet qui offre du contenu dupliqué. Et heureusement ! Votre contenu sera « simplement » retiré du SERP… vous garantissant une visibilité nulle !

Quant aux pénalités, elles sont rares. Il s’agit de cas extrêmes, conséquences de la mise à jour Google « Panda » de 2011 et qui visait spécifiquement les « fermes de contenus ». Ces dernières cherchaient à réaliser des revenus publicitaires en agrégeant de manière automatique des contenus extérieurs.

L’important pour vous est de comprendre que l’objectif de Google est de toujours offrir un contenu qui répond précisément aux attentes de l’internaute. Si celui-ci recherche une télévision Samsung, Google ne va certainement pas lui proposer 5 pages identiques. Il va en choisir une seule… et exclure les autres. Partant de là, vous avez tout intérêt à vous démarquer de vos concurrents en créant des contenus originaux, mais aussi en utilisant certains outils.

Comment l’éviter ?

Voici quelques conseils pour gérer au mieux les contenus dupliqués sur votre site internet.

Créez des contenus 100 % originaux

Un conseil que certains pourraient considérer comme évident. Pourtant, la plupart des PME ne comprennent pas la nécessité de cet argument. La faute souvent au coût d’une telle mesure. Créer des contenus originaux et de qualité est onéreux. Par ailleurs, difficile d’internaliser ce travail puisqu’elle requiert de véritables compétences en rédaction web.

Il existe de nombreuses agences spécialisées. Vous pouvez également trouver des rédacteurs indépendants sérieux, professionnels et efficaces. C’est d’ailleurs un des meilleurs investissements que vous pouvez faire pour vous démarquer.

Devenez amis avec la balise canonical

Dans le cas de plusieurs pages identiques présentes sur votre site internet, la balise Canonical indique à Google quelle est l’originale et quelles sont celles qu’il peut ignorer.

Pour reprendre un exemple réel, un de mes clients possède un site e-commerce de vente de matériel de cuisine. Comme dans l’illustration du début de cet article, il avait été décidé de gérer la déclinaison des couleurs d’une référence de robot par autant de fiches produits que de couleurs. Il y avait donc ici un cas évident de duplicate content.

Pour éviter à ce client le risque de voir ses efforts en SEO réduits à néant, nous avons inséré une balise canonical faisant pointer 11 des 12 fiches produits identiques vers une seule et même fiche.

L’intégration technique est très simple, quel que soit votre CMS. Cela se gère par l’ajout d’un module. Dans le cadre de Prestashop, j’utilise « URLs Canoniques pour Éviter le Contenu Dupliqué – SEO » qui est très facile à mettre en place. Si votre site internet est sous WordPress, le module Yoast vous permet d’insérer cette balise sans difficulté.

La balise Noindex

Parmi les solutions techniques pour limiter les risques de contenus dupliqués, vous pouvez spécifier aux robots de Google qu’il existe sur votre site des parties qui ne doivent pas être référencées.

Si vous utilisez un CMS comme WordPress, sachez qu’il génère facilement des contenus dupliqués. Par exemple, un même contenu peut se retrouver sous plusieurs URL.

Vous pouvez dans ce cas intégrer une balise « noindex » qui indique au GoogleBot de ne pas prendre en compte certaines des pages de votre site internet.

Profitez des faiblesses de vos concurrents

En prenant conscience de l’importance du duplicate content pour Google, vous comprenez certainement qu’il y a quelque chose à jouer. En effet, aujourd’hui, rares sont les PME qui saisissent les conséquences des contenus dupliqués sur leur visibilité.

Par conséquent, prenez-les à contrepied et investissez dans la création de contenus originaux et de qualité :

  • vous apporterez à vos clients de la valeur,
  • les internautes seront satisfaits de lire vos écrits,
  • votre site internet gagnera en visibilité.

Vous avez donc tout à y gagner !