Best Of Référencement naturel — 18 septembre 2015 — 6 commentaires
Tout savoir sur le contenu dupliqué

Bien optimiser son site internet pour être bien référencé passe par un ensemble de critères à respecter. Du contenu au maillage interne en passant par les différentes balises, l’optimisation on-page d’un site web requiert de suivre quelques règles. L’un des critères principaux de référencement est la qualité de votre contenu. Google favorise des sites ayant développé une stratégie de contenu qualitatif, riche et unique. Le contenu dupliqué ou proche est donc fortement pénalisé….

Le contenu dupliqué, qu’est-ce que c’est ?

Il s’agit de contenu qui apparait plus d’une fois sur un site web, aussi bien au sein du même site web qu’à l’extérieur de celui-ci. Le contenu dupliqué est pénalisé, car il pose problème aux robots d’indexation pour savoir quel contenu est l’original et quelle partie est dupliquée. Il leur sera alors difficile de délivrer la bonne information lors d’une requête utilisateur.

Google encourage de plus en plus les sites web à proposer une meilleure expérience utilisateur, mais le contenu dupliqué est contraire à cette tendance. C’est pourquoi les robots Google n’afficheront pas tous les contenus dupliqués et seront donc obligés de choisir le plus pertinent. Le problème avec ce type de contenu, c’est qu’il mène à une perte en qualité et donc de trafic. Même si tous les types de contenu dupliqué ne sont pas aussi dangereux, ils peuvent conduire à 3 types de problèmes :

  • Une perte d’efficacité des métriques de liens (trust, ancres de texte, jus de lien, autorité), car il est difficile de les rediriger vers la bonne page ou entre les bonnes versions ;
  • Une impossibilité de référencer la bonne version du contenu pour une requête donnée ;
  • Une confusion à indexer la version originale.

Quels sont les types de contenu dupliqué à éviter?

Certains types de contenu dupliqué auront un impact plus négatif que d’autres sur votre référencement naturel.

Les URLs similaires

Google considère les URLs www, non-www, .com, .com/index, http ou https comme différentes alors qu’elles pointent vers la même page. Elles sont donc perçues comme étant du contenu dupliqué. De même, les paramètres de tracking de clics ou les codes analytiques peuvent engendrer du contenu dupliqué.
Exemple :

www.monsiteweb.com/blue-shirt?color=blue
www.monsiteweb.com/blue-shirt

Les fiches produits

Ceux qui développent un site e-commerce connaissent certainement cette situation. Si vous utilisez les descriptions produits envoyées par votre fournisseur, vous risquez d’être pénalisé. Vous n’êtes certainement pas le seul à vous procurer ces produits et donc votre description de contenu se retrouvera sur de nombreux sites web. Google considérera ces pages comme contenant du contenu dupliqué.

Les informations issues de sites tiers

Si vous souhaitez intégrer du contenu issu d’un autre site comme un extrait, une citation ou un commentaire, votre contenu risque d’être perçu comme étant dupliqué même si vous avez inséré un lien renvoyant vers la source. Google donne peu de crédit à ce type de contenu et pourrait baisser votre score de qualité.

Les versions imprimables

Le contenu de vos pages peut être imprimable et causer des problèmes de contenu dupliqué si plusieurs versions d’une page sont indexées.
Exemple:
www.unsiteweb.com/blue-shirt
www.unsiteweb.com/print/blue-shirt

Les identifications lors de sessions

Si chaque visiteur se voit donner un identifiant de session différent lors d’une visite sur votre site web, celui-ci sera alors gardé dans l’URL et causera des problèmes de contenu dupliqué.
Exemple:
www.unsiteweb.com/blue-shirt?SESSID=320
www.unsiteweb.com/blue-shirt

Les filtres et catégories

De nombreux sites e-commerce disposent de filtres et de catégories pour organiser les recherches de l’utilisateur et qui génèrent donc des URLs uniques. Le problème, c’est que même si ces URLs sont différentes et ordonnent le contenu différemment, ce dernier reste le même et crée donc du contenu dupliqué.

Les outils de détection

Il existe quelques outils pour vous aider à détecter votre contenu dupliqué, en voici 3 gratuits :

Siteliner

Cet outil permet de détecter les erreurs de contenu, dont le contenu dupliqué.

siteliner duplicate content

OnCrawl

OnCrawl permet de réaliser un audit complet des performances SEO de votre site web et détecte notamment le contenu proche ou dupliqué, les clusters de page et votre répartition par mots-clés.

duplicate content detector

Copyscape

Cet outil détecte le contenu dupliqué en dehors de votre site web.
duplicate content

Comment éviter le contenu dupliqué ?

Il existe quelques méthodes afin de faire face à ce type de contenu. Dans de nombreux cas, les différentes URLs ont besoin d’être canonicalisées par le biais de redirections 301, de la balise canonique ou à l’aide de paramétrages Google Webmaster Central.

Redirection 301

La redirection 301 aide les moteurs de recherche à déterminer quelle version indexer, c’est-à-dire qu’elle permet de choisir la version originale et de lier les versions dupliquées à cette première. De même, il est possible que plusieurs pages bien référencées soient liées à une même page. Dans ce cas-là, la redirection 301 permet de créer un signal de popularité plus fort et de ne plus mettre ces pages en compétition.

La balise canonique

Dans la même lignée que la redirection 301, la balise canonique est néanmoins plus simple à mettre en place et peut être insérée pour gérer du contenu dupliqué externe. Elle informe les moteurs de recherche que votre version n’est pas l’originale et que vous en êtes conscient. Le jus de lien sera donc attribué à l’original.

Le NoIndex, NoFollow

Cette balise permet de ne pas indexer des pages dupliquées et donc de ne pas heurter votre référencement.

Le domaine par défaut

Ce réglage très simple permet d’attribuer un domaine par défaut à votre site. Les résultats de recherche sont donc automatiquement affichés avec le même type d’URL comme www dans les pages de résultats.

Les descriptions uniques

Pour les sites e-commerce, essayez au maximum de proposer des fiches produits uniques. Certes cette opération prendra du temps, mais à long terme, elle vous permettra de mieux vous positionner par rapport aux concurrents qui auront gardé les descriptions par défaut dupliquées.

Articles similaires

Articles Recommandés



L'auteur

Emma Labrador

Chargée de communication à Cogniteev, startup spécialisée dans le Big Data, j'écris quotidiennement sur le SEO sur le blog http://www.oncrawl.com/blog/ et de façon ponctuelle pour d'autres blogs SEO et webmarketing. Grande fan de dispositifs social media, de digital mais aussi de SEO, j'interviendrai sur Webmarketing & Co'm pour partager des articles sur le référencement naturel, ses dernières mises à jour ou de marketing de manière plus large.

 


6 Commentaires

  1. Bonjour Emma,

    Je m’occupe d’un site ecommerce, et j’ai remarqué grâce à un des outils listés que j’avais bcp de contenus dupliqués sur plusieurs pages « Rayon » (ou catégories). Par exemple le listing produit sera le même sur Téléviseur et TV LED, la plupart du contenu aussi…

    Comment s’en sortir sans délaisser le référencement d’une catégorie au profit d’une autre ?

    Je te remercie pour ton aide, si tu peux me l’apporter ! Sinon si tu connais quelqu’un à même de le faire merci aussi 😉

    • Bonjour Julien,

      Votre question est une vraie problématique pour les sites de ecommerce ou même les sites de petites annonces.

      Il se trouve que Google parvient très bien à identifier les blocs de chaines de caractères similaires d’une page à l’autre. Il y a donc un vrai problème à afficher les mêmes blocs produits d’un rayon à un autre. Mais pour Google tout est question d’équilibre. J’ai tendance à recommander que les listings produits ne représentent que moins de 30% du contenu texte de la page (hors menus de navigation). Vous pouvez en général réussir à atteindre ces proportions avec un texte présentant le rayon, les principales marques, etc. Il peut être également intéressant de classer les produits par top vente / catégorie et ainsi limiter les blocs produits dupliqués sur la page 1 du rayon selectionné. Pour les autres pages je recommande de les passer en noindex follow de manière à ne faire indexer que les pages produits et pas les pages « Categorie page 2, 3 … »

  2. Bonjour Emma,

    Merci pour cet article très technique.

    Certes Google n’aime le content duplication mais je me permets de réagir car outre la question du référencement, on peut peut-être évoquer aussi la malhonnêteté intellectuelle et la propriété intellectuelle non ?

    Dommage ! Les auteurs ont des droits.

    Bien à vous,
    Léa

  3. Bonjour et merci pour cet article.
    J’ai une petite question : est-ce que une catégorie avec une URL : http://www.domaine.com/A
    Peut créer un duplicate content si on a un article dans cette catégorie A qui porte le même nom que la catégorie, soit : http://www.domaine.com/A/A ?
    Merci 🙂

  4. @julien

    Pour repondre a ta question, il faut vérifier quels sont les urls les mieux positionner (sur Google)televiseur ou tv led.
    Si par exemple televiseur est mieux référencer que tv led.
    Rajoutes la balise canonical a la page tv led. Dans la balise canonical tu la fais pointer vers ta page televiseur.
    Dansouied(arobaze)GmailPointCom

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *