4 pièges à éviter pour vos URLs en matière de référencement
Google revient, via son blog webmaster, sur les bonnes pratiques en matière d’écriture d’URL et fait un focus sur les erreurs à éviter pour faciliter le travail d’indexation des moteurs et en particulier de Google Bot…
Le web contient énormément de contenu, pour des questions de ressources, les moteurs ne peuvent en indexer qu’une partie et c’est les liens et les URLs qui vont l’aider dans ce travail. D’une manière générale, on évitera la complexification des URLs et la redondance pour éviter le duplicate content.
Plusieurs pratiques sont à éviter, c’est dans ce but que Google a réalisé une présentation sur les pratique à éviter en matière de liens. Voici un résumé :
- Evitez les Ids de session et autres infos sur l’utilisateur : Google conseille de supprimer les ids de session et autres variables n’ayant pas d’influence sur l’affichage de la page pour les mettre dans un cookie. L’effet sera le même et les URLs seront allégées.
- Supprimez les liens infinis : l’exemple classique de ce genre de liens : les calendriers. Sur certains sites, on retrouve des calendriers. Chaque année, chaque mois et chaque jours des prochaines années sont paginés et créent une multitude d’URLs même si les dates ne contiennent aucune donnée. Il suffit de bloquer l’accès à ces pages via le fichier robots.txt.
- Ne faites indexer que les pages performantes : certaines pages comme les formulaires, les pages contacts… ne peuvent pas être jugées pertinentes ou non par un moteur. Google conseille donc de les bloquer via robots.txt. Sur ce point, j’émet un bémol, pourquoi ne pas ajouter un contenu pertinent sur ces pages : un paragraphe de présentation, d’explication du formulaire… et les rendre ainsi plus parlantes aux yeux des moteurs.
- Une URL par page : une URL ne doit renvoyer que vers un seul contenu et un contenu ne doit être accessible que par une URL. Si votre CMS génère plusieurs URLs pour une même page, pensez à utiliser l’attribut « canonical element ».
Plus de précisions sont données dans la présentation…
Source : Google Webmaster Blog





Référencement le 11 août 2009:
Pour gérer facilement votre duplicate content interne vous pouvez aussi utiliser la balise URL canonique. Placée entre les balises de chaque page, cette balise indique à Google et aux autres moteurs de recherche que la page concernée propose le même contenu que la page à laquelle elle fait référence. Source : http://www.question-referencement.linkeo.com/?p=52
[Reply]
Clem le 11 août 2009:
Complètement d’accord avec vous concernant les pages de formulaires (type Contact, etc…).
Ajouter du texte de présentation, ou un complément d’informations (carte / plan d’accès par exemple, avec un attribut ALT pertinent sur l’image), rend la page potentiellement intéressante à crawler pour le robot.
De plus, on peut tout à fait imaginer un internaute qui recherche, via Google, les coordonnées de contact de telle entreprise. Une landing-page avec présentation et form’ de contact devient tout de suite pertinente
[Reply]
Campagne le 18 août 2009:
Quand on est sur des pages de listes, avec une navigation entre les pages suivante, précédente, 1, 2, 3,… etc. Il faut aussi éviter de revenir à la première page en ajoutant l’argument ?page=1 car cela fait de la duplication de contenu si cette même page est accessible depuis le reste de la navigation sans argument.
[Reply]
Consultant référencement le 20 décembre 2010:
Assez d’accord avec vous sur l’ajout de contenu pertinent dans les pages jugées peu pertinentes. Sur le blog Ya-graphic on peut voir qu’avec du travail une page partenaire peut devenir attrayante… http://www.ya-graphic.com/2009/05/comment-tirer-profit-d%E2%80%99une-page-partenaires/
[Reply]