Avant toute chose, le meilleur moyen d'éviter le duplicate content interne, c'est de faire une structure de site cohérente. C'est la base de l'optimisation on site. Cela passe éventuellement par une refonte de votre catalogue produits. Le premier axe de progrès est bien souvent d'utiliser des produits configurables sur un site e-commerce. Prenons un exemple: dans la vente de chaussure cela permet d'éviter d'avoir deux Urls avec le même contenu à une pointure prêt.
En analysant google webmaster tools, vous serez capable de trier rapidement votre duplicate content, détecté par meta description identiques, ou balises title identiques. Une fois ce travail fait, je vous suggérerais de faire une passe rapide sur les urls incriminées. Il s'agit en effet souvent d'un changement de catégorisation d'articles, ou l'installation d'un module seo différent, ou simplement un changement de stratégie seo.
Si vous répondez oui à au moins l'une de ces questions, vous avez probablement un problème de contenu dupliqué.
Il est tout à fait possible qu'un même article soit accessible par plusieurs points, et avec des urls différentes, pour simuler le parcours de "amélioration html" de google, vous pouvez utiliser Xenu. J'en détaille l'utilisation dans mon article sur le maillage interne.
Le mieux pour optimiser la disparition de ce contenu est de mettre en place des redirections 301 dans votre .htaccess. La ligne à ajouter dans votre .htaccess peut se présenter ainsi :
Une fois quelques jours écoulés, vous pourrez constater rapidement que votre écran de suggestion html s'en trouvera bien plus vide, et votre référencement s'en retrouvera également amélioré !
L'analyse des suggestions html de google webmaster tools vous montre sans doute l'effet indésirable de la pagination: le duplicate content, vous listant des erreurs de ce type: /?start=5 /?start=10 /?start=15 etc... Afin d'optimiser votre site pour le référencement, le duplicate content étant clairement pénalisant, une solution facile à mettre en place consiste à modifier vos liens de paginations. Ajoutez-y simplement l'attribut rel="nofollow". Vous empêcherez ainsi google et d'autre robots de moteur de rechercher de crawler vos pages et d'indexer des pages ayants ayant les mêmes balises titles, et meta descriptions. Vos liens ressembleront ainsi à quelque chose comme ça :
Quels sont les moyens d'optimiser la visibilité de votre boutique en ligne ?
Nous recrutons en mai 2022 un SEO Senior en tant que consultant en référencement chez 410 Gone, rejoins-nous !
Savez-vous que le maillage interne est la base d'une bonne organisation des contenus orientés SEO ?
Tutoriel complet pour migrer en https sans rien oublier d'un point de vue SEO !
Comment optimiser l'affichage de votre meta title ?