Ce fichier permet de gagner du temps dans le référencement du site car il évite d’avoir à crawler l’ensemble du site pour trouver les pages. Il permet également de gagner du temps dans le référencement de nouvelles pages ou lors de modifications de pages.
Le SEO (Search Engine Optimization) est un vaste domaine qui allie des expertises techniques et des expertises propres à la gestion et l’organisation des contenus. Sans être le seul, le sitemap.xml est un élément clef et sous très révélateur d’une bonne politique SEO technique.
Mon sitemap.xml pour les moteurs de recherche mais pas que…
Le fichier sitemap.xml est comme nous l’avons indiqué un élément important pour les moteurs de recherche mais c’est également un des premiers éléments à regarder lorsque l’on réalise l’audit d’un site. En effet, ce fichier permet de déceler de nombreux petits problèmes plus ou moins graves que vous pouvez voir ci-dessous :
1. L’absence du fichier
L’absence du fichier est en général un mauvais point car il indique que le développement n’a peut-être pas pris en compte le référencement du site.
Sans fichier, les moteurs vont simplement parcourir votre site en suivant les liens, ce qui peut engendrer 2 problèmes majeurs:
- Tous les contenus de votre site ne sont pas forcément “trouvables” via des liens.
- Les moteurs se perdent dans une navigation complexe
2. Le mauvais paramétrage du domaine du fichier
Il arrive de constater de nombreuses fois que le fichier était paramétré avec le domaine de preprod ou celui des développeurs : localhost.
Contrairement au premier point, cela montre que le référencement est bien pris en compte mais qu’il y a un problème dans le déploiement ou dans le contrôle de l’installation.
3. Le fichier ne comporte que le nom de domaine
Cette erreur est également assez fréquente. Cela correspond en général à un process qui n’est pas lancé pour mettre à jour la liste des pages.
4. Les URL ne sont pas réécrites
Il arrive régulièrement de voir des URLs qui ne sont pas réécrites dans les fichiers sitemap.xml. Avec Drupal par exemple, il reste des url du type /node/XXX
Cette erreur montre qu’un travail pour le référencement est encore à mettre en place au moins pour certains types de données.
5. Des URL correspondant à des types de données ne devraient pas exister
Des URL sont généralement générées par les CMS pour correspondre à des groupements de Taxonomy ou à des Templates que vous n’utilisez pas.
En effet, un CMS, par définition et par défaut, essaie d’afficher tous les contenus qu’il contient. Il est donc commun de voir des pages qui ne sont pas vraiment des contenus qui remontent comme des pages.
Le référencement de ces pages (souvent avec un design qui n’a pas été contrôlé) peut donner l’impression à vos utilisateurs qu’il y a un problème sur votre site.
Cette erreur correspond régulièrement à une template mal maîtrisée ou à un mauvais contrôle.
Dans le cas de Drupal, il n’est pas rare de trouver des pages correspondant à des taxonomy qui répertorient l’ensemble des contenus d’une page mais avec un design qui ne correspond pas au site.
Dans le cas d’eZ Platform, c’est souvent la Media Library qui est indexée par erreur.
6. Des contenus de test non supprimés
Le fichier sitemap.xml permet régulièrement de voir que les contenus qui ont été utilisés pour le développement du site n’ont pas été supprimés. Même si on ne peut pas les voir depuis les menus ou en suivant les liens dans les pages, ces contenus peuvent être référencés par les moteurs de recherche.
Pour faire ce contrôle, il est important de regarder les contenus les plus anciens ou de faire une recherche rapide dans le fichier sitemap.xml sur les termes ‘test’, ‘lorem’ …
Pour conclure
Le fichier sitemap.xml est évidemment un élément important pour le référencement de votre site mais il vous permet également un contrôle rapide des optimisations mise en place pour votre site.
Gilles Glaye, Responsable de l’offre Drupal, pôle Web & Mobile Almavia CX
Almavia CX accompagne ses clients dans leur transformation digitale, sur toute la chaine de l'Expérience Client, en plaçant l’humain au cœur de son savoir-faire et au centre de sa stratégie.