+400% de trafic en moins d’un an comme notre client Colony & Co, ça vous tente ? Découvrez comment grâce à une stratégie SEO personnalisée
Comment détecter le duplicate content interne?
Avec google webmaster tools
En analysant google webmaster tools, vous serez capable de trier rapidement votre duplicate content, détecté par meta description identiques, ou balises title identiques. Une fois ce travail fait, je vous suggérerais de faire une passe rapide sur les urls incriminées. Il s’agit en effet souvent d’un changement de catégorisation d’articles, ou l’installation d’un module seo différent, ou simplement un changement de stratégie seo.
En vérifiant la checklist duplicate content
- Est-ce que mon article est présent dans plusieurs catégories et accessible via plusieurs urls?
- Est-ce que mon .htaccess tolère les majuscules dans les urls?
- Est-ce que mon site est accessible avec et sans www ?
- Est-ce que mon site est accessible via http ET https?
Si vous répondez oui à au moins l’une de ces questions, vous avez probablement un problème de contenu dupliqué.
En analysant le maillage interne de votre site
Il est tout à fait possible qu’un même article soit accessible par plusieurs points, et avec des urls différentes, pour simuler le parcours de « amélioration html » de google, vous pouvez utiliser Xenu. J’en détaille l’utilisation dans mon article sur le maillage interne.
Comment régler ce problème?
Via les redirections
Le mieux pour optimiser la disparition de ce contenu est de mettre en place des redirections 301 dans votre .htaccess. La ligne à ajouter dans votre .htaccess peut se présenter ainsi :
Une fois quelques jours écoulés, vous pourrez constater rapidement que votre écran de suggestion html s’en trouvera bien plus vide, et votre référencement s’en retrouvera également amélioré !
Via l’optimisation de la pagination
L’analyse des suggestions html de google webmaster tools vous montre sans doute l’effet indésirable de la pagination: le duplicate content, vous listant des erreurs de ce type: /?start=5 /?start=10 /?start=15 etc… Afin d’optimiser votre site pour le référencement, le duplicate content étant clairement pénalisant, une solution facile à mettre en place consiste à modifier vos liens de paginations. Ajoutez-y simplement l’attribut rel= »nofollow ». Vous empêcherez ainsi google et d’autre robots de moteur de rechercher de crawler vos pages et d’indexer des pages ayants ayant les mêmes balises titles, et meta descriptions. Vos liens ressembleront ainsi à quelque chose comme ça :