Le duplicate content est un facteur négatif dans le référencement SEO. Par exemple, il peut s’agit de plusieurs URLs avec le même contenu.Les moteurs de recherche, comme Google, considèrent ceci comme un abus de la part du gérant du site Internet (c’est à dire la volonté de faire comme si le volume de pages était plus important).

Le duplicate content est un risque au niveau de la position dans les recherches (une sanction peut entrainer une baisse d’audience) et un mauvaise e-réputation :

  • Popularité : elle est distribuée entre plusieurs urls au lieu de se concentrer sur une seule adresse.
  • Positionnement : les moteurs de recherche, comme Google, peuvent pénaliser le site Web en termes de position dans les résultats de recherche.

Si vous êtes victime de pénalité, résoudre un cas de duplicate content n’est pas obligatoirement compliqué. En général, il s’agit de créer des redirections de type 301 et/ou un fichier robots.txt (selon les cas).

Il existe différentes techniques pour identifier un duplicate content

En voici quelques unes :

  • Cas classique : si votre site web ne dispose pas de sous nom de domaine, naviguez en utilisant d’une part l’adresse avec « www » et sans « www ». Si vous pouvez naviguer sans constater de redirection, vous serez face à un problème de duplicate content.
  • La page d’accueil fait souvent l’objet d’un duplicate content. Rendez-vous sur la page d’accueil de votre site web de plusieurs façons (en saisissant l’adresse de votre site, en cliquant sur les liens pointant vers votre page d’accueil sur votre site comme le logo etc.), vous serez alors en mesure de constater si votre page d’accueil existe sous différents urls, sans redirection, constituant un cas de duplicate content.
  • Mettre en ligne un même site web sous plusieurs noms de domaines, représente un cas de duplicate content. L’audit de votre système web peut vous permettre d’identifier qu’au moins deux sites présentent des pages similaires (au moins 70%). Envoyer une requête contenant quelques lignes de contenus d’une page dans un moteur de recherche peut vous permettre d’identifier les pages concernées.
  • Si vous disposez d’une pré-prod, il convient de s’assurer que les pages de pré-prod ne soient pas indexées par les moteurs de recherche. L’insertion par mégarde de liens pointant vers les pages de pré-prod sur son site officiel peut entraîner l’indexation des pages de pré-prod. Les moteurs de recherche connaissent donc deux urls différents pour une page similaire, se traduisant par un duplicate content.
  • Autre moyen de repérer un duplicate content : utilisez le service Google Webmaster Tools et consultez la liste des urls portant le même title. Derrière cette liste d’urls peuvent se cacher des cas de duplicate content.