Skip to main content
SEO

Comment gérer le contenu dupliqué en SEO ?

Faisons le point sur le contenu dupliqué en SEO. Google pénalise ? Ne pénalise pas ? Le sujet fait débat depuis un moment dans la sphère SEO. Qu’est ce que le contenu dupliqué ? Quel est son réel impact sur le référencement d’un site web ? Comment le détecter et le gérer ? Avec quels outils ?

Définition du contenu dupliqué en SEO

Google défini lui-même le contenu dupliqué comme :

« des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques dans la même langue ou sensiblement similaires. »

Plus précisément, on peut en distinguer deux types :

copier coller ctrl c et ctrl v min

Le contenu dupliqué intra site (interne)

En interne, il arrive très souvent que l’on soit obligé de copier coller une partie de contenu sur plusieurs pages. C’est le cas sur des sites e-commerce où il faut parfois ajouter des mentions légales ou techniques sur les fiches produits. Egalement, il peut arriver que l’outil utilisé pour la création du site internet (WordPress ou autre) soit mal configuré et créé tout un tas de pages en double avec du contenu strictement identique. De manière général, on distingue le contenu dupliqué interne lorsque celui-ci est présent sur deux ou plusieurs pages du même site.

Le contenu dupliqué extra site (externe)

A l’inverse, le contenu dupliqué externe est un contenu identique ou très similaire que l’on trouve entre 2 pages web de sites différents. Cela peut arriver quand un éditeur en copie un autre ou quand un site e-commerce vend les produits d’une autre marque. La description de la fiche produit est alors identique sur le site de la marque et sur celui du revendeur.

Comment détecter le contenu dupliqué ? Quel outil utiliser ?

Dans un premier temps, il convient de noter que Google ne prend en compte que le main content d’une page pour décider s’il y a duplication ou non. Exit donc le footer, sidebar ou header. Lorsqu’un contenu est identique à plus de 70%, on parle alors de near duplicate. Lorsque le contenu est 100% identique, on parle de duplicate content.

Tout semble donc être une question de pourcentage de copier-coller. Qu’on se rassure donc, les quelques mots de présentation technique ou point légal sur 100% des fiches produits ne posent pas soucis à condition qu’il y ai un minimum de contenu sur ces pages. Je recommande toujours au moins 500 mots pour les fiches produits et 1000 mots pour les pages et articles de blog.

Comment le détecter sans outil ?

Pour détecter rapidement du contenu copier-coller sans outil SEO, vous pouvez rechercher une partie d’un texte sur Google en la mettant entre guillemet. Si vous tombez sur un contenu externe d’on vous ignorez l’existence, ce n’est pas bon signe. Cette méthode est limitée car vous ne pouvez rechercher que 32 mots maximum à la fois. Néanmoins, c’est une méthode facile si l’on a des doutes de plagiat sur un contenu précis.

Quels outils pour détecter le contenu dupliqué ?

siteliner outil de détéction du contenu duplique interne min

Voici une liste d’outils pour détecter le contenu dupliqué interne ou externe :

  • Copyscape : redoutable pour détecter le contenu externe
  • Siteliner : pour rechercher du contenu similaire en interne
  • Duplicate checker : outil gratuit et facile à utiliser
  • Killduplicate.com : payant et très utile pour monitorer son duplicate content sur le long terme

Quel impact du contenu dupliqué sur le référencement ?

Google aime le contenu original et de qualité depuis 2011. La sortie de son algorithme Panda lui permet de lutter contre le contenu de mauvaise qualité et le spam. A travers ce filtre, Google est donc capable d’identifier le duplicate content interne ou externe.

À ne pas rater !
Audit SEO Offert

Je fais un premier état des lieux de votre site web manuellement. Testez votre site web !

Adresse e-mail non valide

Que ce passe t-il quand Google détecte du contenu dupliqué ?

Lorsque deux pages ont un contenu similaire, Google va essayer d’établir la paternité du contenu d’origine. Pour cela, il ne se base pas sur la date de publication mais plutôt sur l’indice de confiance du site web (ancienneté, qualité des backlinks, qualité du contenu du reste du site, notoriété…)

Pénalité or not pénalité ?

Dans la majorité des cas, Google n’applique pas de pénalité pour contenu dupliqué. Ce que pénalise Google, c’est la manipulation du classement d’un site dans les SERP.

Le contenu en double n’entraîne pas de conséquences négatives particulières pour votre site sauf si l’objectif semble être de tromper et de manipuler les résultats des moteurs de recherche. En cas de problèmes de contenu en double, […], nous nous chargeons de choisir la version du contenu à afficher dans nos résultats de recherche.

Google nous indique ici le plus gros risque à avoir du contenu dupliqué interne ou externe. Lorsque les robots sont confrontés à 2 pages identiques, Google va choisir une URL qu’il affichera dans son index. L’autre URL n’aura pas ou très peu de visibilité SEO voir elle ne sera même plus crawlée et donc indexée.

copier coller google ne pénalise pas min

En interne, c’est une perte de visibilité et de temps. De plus, cela peut faire baisser le référencement de tout le site s’il y a beaucoup de pages dupliquée. Pour un gros site web, cela peut aussi avoir un impact sur le budget crawl.

En externe, c’est un réel danger car un site qui a plus d’autorité que vous peut donc « voler » votre contenu et s’en sortir.

Comment éviter de créer du contenu dupliqué ?

Voici comment éviter de créer du contenu dupliqué en interne : 

  • Evitez le copier coller : c’est tout bête.
  • Faites une redirection entre la version HTTP et HTTPS de votre site : le tuto pour WordPress ici.
  • Utilisez la balise Hreflang si vous avez plusieurs contenus dans la même langue mais pour différents pays (France/Belgique par exemple).
  • Utiliser un sitemap clair et précis et envoyé le à la Search Console.
  • Dans certains cas, utilisez une redirection 301 (via le plugin « redirection » sur WordPress)
  • La meilleure solution : utiliser une balise canonical. Pour plusieurs contenus identique, cette balise vous permet d’indiquer à Google qu’elle la page originale. Sur WordPress, il est facile de gérer l’ajout de cette balise via des plugins SEO comme SEOPress ou encore Yoast SEO.

Voici comment lutter contre le contenu dupliqué en externe :

  • Retirez la possibilité de cliquer vous permettra de limiter le copié collé en masse. Beaucoup de plugins WordPress vous permette de le faire.
  • Contactez la personne qui vous a plagié : très souvent, l’administrateur supprime de lui même le contenu.
  • En dernier recours, vous pouvez utiliser le système de plainte de Google. D’après la loi américaine DMCA, vous pouvez demander à Google de désindexer la page du site qui vous a plagié.

ecoliers qui copie sur son voisin min

Causes du contenu dupliqué

Les causes d’un contenu en double sont multiples et varient.

Causes du contenu dupliqué interne

  • Copier coller manuel : l’administrateur du site à volontairement dupliqué un contenu
  • Indexation de la version HTTP et HTTPS et/ou de la version www et sans www
  • Conservation d’anciennes URL suite à une refonte par exemple
  • Erreurs de configuration dans le CMS : avec WordPress, on voit souvent le problème avec les pages catégories ou étiquettes.
  • Erreurs de configuration dans les permaliens

Causes du contenu dupliqué externe

  • Plagiat : c’est le plus courant
  • Copier coller de la part d’un partenaire qui vend vos produits
  • Copier coller lors de l’utilisation de plateforme de réseaux d’entreprises comme c’est souvent le cas en immobilier

Conclusion

En bref, Google pénalise très rarement le contenu dupliqué. Les moteurs de recherche pénalisent surtout lorsqu’il y a tentative de manipulation des résultats de recherche. Le plus gros souci du duplicate content, c’est surtout la perte de visibilité. Un contenu en double fait perdre du budget crawl, diminue la qualité globale du site (donc le SEO) et ne sera probablement pas indexé.

Testez votre site web avec les outils ci-dessus. Votre site web doit être le plus propre possible.

Florian Zorgnotti

Consultant SEO WordPress à Nice, j'accompagne les info-preneurs, TPE et PME dans leur stratégie webmarketing et leur recherche de visibilité sur le web. Spécialisé en référencement WordPress, je propose aussi du coaching et des formations en ligne.

Laisser une Réponse

5 + seize =