Qu’est-ce que le contenu dupliqué et comment l’éviter ?

par Marie Beaupere
le 09/11/2016

Le contenu dupliqué est la bête noire de tous les référenceurs et propriétaires de site internet. Chassé dès l’audit d’un site web, le contenu dupliqué ou « duplicate content » sous son appellation anglo-saxonne, est l’ennemi de votre site web. Comment reconnaitre du contenu dupliqué et comment s’en prémunir ?

le contenu dupliqué en référencement

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué est la répétition d’un contenu éditorial d’une page à une autre ou d’un site à un autre. Ce phénomène peut se produire en de maintes occasions.
Un des cas les plus flagrants survient à la mise en ligne d’un nouveau site web, avec un contenu éditorial souvent négligé. Un plagiat de ce qui existe ailleurs, sur un autre site web de même thématique, est souvent utilisé pour être injecté dans le nouveau site web. Outre que ceci représente un vol manifeste de contenu éditorial, c’est aussi un risque de sanction SEO appliquée par Google au site copieur. Ce dernier peut se retrouver dégradé dans les résultats, voire même en disparaitre complètement si plusieurs pages de contenus dupliqués sont détectées par Google. C’est un filtre créé par Google, du nom de « Panda » qui en est généralement à l’origine.
Cette sanction très lourde demande beaucoup de temps et de travail pour en sortir.

Pour vérifier si votre site ne présente pas de contenus dupliqués, il existe un outil en ligne gratuit et pratique que vous pouvez consulter à cette adresse : www.positeo.com
 

Le contenu dupliqué involontaire

Lors du contrôle d’un site, un référenceur va se livrer à un petit rituel professionnel. Il va se positionner sur la page d’accueil de votre site, effacer les trois www du nom de domaine et rafraîchir la page. Cette manipulation permet de se rendre compte si le site dispose d’une redirection renvoyant le contenu d’un site.com vers www.site.com.
Si cette redirection n’a pas été faite, votre site présente un bel exemple de contenu dupliqué, avec tout le contenu accessible depuis les adresses de pages avec et sans les www.

Il existe d‘autres cas possibles de contenu dupliqué, comme celui généré par les paramètres de session attribués à un visiteur de votre site, les filtres permettant de trier les produits (par prix, par taille, du plus cher au moins cher…) sur un site e-commerce. Ces filtres entrainent la création de pages identiques accessibles via différentes urls.

Les solutions à mettre en œuvre

Dans le cas d’un site publié à la fois sous le nom de domaine avec et sans les www, un simple fichier .HTACCESS permettra de renvoyer le contenu sur l’une ou l’autre adresse.
Une déclaration de préférence pour l’une ou l’autre adresse peut également être faite dans l’outil « Google Search Console » (nommé auparavant « Google Webmaster Tools ») pour indiquer à Google de quelle manière indexer le site.

Les pages générées par les filtres permettant de trier une page produit peuvent également ne pas être indexées en les signalant dans « Google Search Console ». Le fichier Robots.txt peut aussi être un moyen de déclarer des pages à ne pas indexer. (Un exemple ci-dessous d’un fichier Robots.txt : la ligne « Disallow » permet de bloquer l’accès des robots, aux répertoires et fichiers indiqués)

Pour éviter le contenu dupliqué, rédigez vous-même le texte de vos pages ou faites appel à un rédacteur web si vous n’avez pas le temps. Votre référencement vous dira merci !
Pour aller plus loin, consultez aussi notre article pour optimiser le référencement de vos images !

ÉCRIT AVEC PASSION PAR
Marie Beaupere

Marie vous accompagne dans votre stratégie de communication. Sa créativité et sa maîtrise de l’ensemble des logiciels graphiques lui permettent de conseiller et de concevoir les maquettes et prototypes de vos projets. Fan d’organisation, elle est l’agenda de l’agence et veille à ce que chaque membre de l’équipe traite l’ensemble des projets dans les délais impartis.

Et sinon ? Vous en pensez quoi ?

À lire également

éviter le contenu dupliqué en référencement
09/11/2016
Le contenu dupliqué est la bête noire de tous les référenceurs et propriétaires de site internet. Chassé dès l’audit d’un site web, le contenu dupliqué ou « duplicate content » sous son appellation…
emotion illustration experience web
29/05/2023
Dans le monde numérique d'aujourd'hui, où les sites web sont devenus une vitrine essentielle pour les entreprises, il est primordial de captiver les utilisateurs dès leur arrivée sur une…
image réduire empreinte numérique
05/06/2023
Dans notre monde connecté d'aujourd'hui, il est facile de se laisser emporter par le tourbillon numérique qui nous entoure. Chaque jour, nous interagissons avec une multitude d’appareils…

Proposez votre brief !

C'est le début d'une belle aventure ! Planifiez une visio ou venez boire un café* à l'agence.
Nos experts analyseront votre projet pour y apporter des conseils, expertises techniques ou encore des idées novatrices et différenciantes.

 

*Notre café est vraiment délicieux et nous le préparons avec beaucoup de soins ☕ Si vous préférez, on a aussi du thé, de la tisane, des chocolats, des chocolatines (désolé, nous ne proposons pas de pains au chocolat), des œufs fraichement pondus, des céréales, des pommes, du lait, des yaourts, du jus de fruits, du beurre (salé), du pain, de la confiture...