Qu'est-ce qu'un sitemap.xml (plan du site ?)

Un plan du site est un fichier qui fournit aux moteurs de recherche des informations détaillées sur toutes les pages, leurs relations et leur contenu (images, vidéos...). Il aide Google et les autres moteurs de recherche à explorer un site de manière plus intelligente. Chaque élément de la liste est directement lié aux catégories correspondantes du site. D'une manière générale, le sitemap est recommandé pour tous les sites, mais les petits sites ne contenant que quelques pages peuvent s'en passer. Tous les grands sites devraient avoir intérêt à en créer un pour améliorer l'exploration de leurs pages par les moteurs de recherche. Le sitemap est également recommandé pour les sites présentant des faiblesses dans leurs liens internes. Certaines pages peuvent en effet être difficiles d'accès parce qu'elles ne sont pas naturellement reliées entre elles. Le sitemap est également utile pour les nouveaux sites qui reçoivent peu de backlinks, ce qui n'incite pas Google à parcourir l'ensemble du site.

Attention, s'il est tentant de faire le raccourci sitemap = indexation de toutes les pages, il n'a en réalité qu'une influence indirecte. Il permet simplement à Google de trouver les pages, mais il sera seul juge de leur qualité et de l'utilité de les indexer. Cela dit, en soumettant un sitemap XML dans la Google Search Console, vous indiquez à Google les pages que vous considérez comme des pages de qualité. S'il s'agit vraiment de pages de qualité, alors vous mettez toutes les chances de votre côté pour les voir apparaître dans les SERP.

Contactez un expert

Réponse sous 24hrs

Que peut contenir un plan du site ?

Avant de commencer à créer un sitemap, vous devez vous demander quelles pages méritent d'être incluses. Commencez toujours par réfléchir à la pertinence d'une URL : serait-elle un bon résultat sur Google ? Répond-elle à un besoin de l'utilisateur ?

Si ce n'est pas le cas, ne l'incluez pas. Toutefois, cela ne signifie pas qu'elle ne sera pas indexée ou explorée. Si vous voulez absolument l'exclure des résultats de recherche, la balise méta no-index est nécessaire.

Les URL internes du site

La première utilité du sitemap est de lister simplement les URLs internes d'un site. L'avantage du format XML est qu'il permet d'ajouter des métadonnées, qui vont enrichir cette liste d'URLs. On peut notamment ajouter :

- Une notion de temporalité, comme la date de la dernière modification de l'URL.
- La fréquence de modification.
- Le degré d'importance de l'URL dans le maillage interne du site.
Bien sûr, comme toujours, Google reste très vague sur l'impact réel de ces métadonnées. Mais dans le doute, pourquoi s'en priver ?

sitemap : Images et vidéos

Le XML sitemap média ou image n'est pas toujours utile pour la plupart des sites. En effet, les images et médias se trouvent généralement dans les pages de vos sites déjà présentes dans la liste des URL de votre sitemap. Ils sont donc explorés en même temps que la page. Certains sites font exception, comme ceux construits sous forme de portfolio (c'est souvent le cas pour les photographes ou les graphistes). Dans ce cas, il peut être judicieux d'afficher un sitemap XML pour distinguer les médias et les images des pages de contenu textuel.

Pour fournir à Google des informations utiles sur vos images, vous devez ajouter des détails pertinents au plan du site standard. Il s'agit notamment du type d'image, du sujet, de la légende, du titre, de l'emplacement, etc.

Comment créer un sitemap ?

Manuellement, en créant un fichier XML. Cette méthode est généralement déconseillée, sauf si vous savez vraiment ce que vous faites ! Il est au moins conseillé d'utiliser un éditeur XML pour créer ce fichier.

En faisant un développement spécifique pour votre site : cette méthode sera la plus puissante et s'adaptera à tous les problèmes de vos sites. Mais c'est aussi la plus coûteuse en termes de ressources. Attention au nombre maximum d'URL dans un fichier sitemap, il est parfois nécessaire de segmenter en plusieurs fichiers.

En utilisant un outil de génération automatique de sitemap (facilement trouvable sur Google). Cette méthode est tentante : peu de travail pour un résultat professionnel !

Mais attention elle a un inconvénient de maintenabilité car si vous changez quelque chose vous devez redémarrer le générateur à chaque fois.

Règles à suivre :

- Le fichier XML doit être enregistré en UTF-8.
- Un plan du site ne peut répertorier qu'un maximum de 50 000 URL et la taille du fichier XML ne doit pas dépasser 50 Mo (52 428 800 octets).

- Toutes les URL répertoriées dans un fichier XML sitemap doivent provenir du même hôte, comme mon-domaine.com par exemple.

Votre sitemap doit être structuré au format XML (sitemap.xml). Si vous utilisez un CMS standard comme WordPress, Joomla, Magento, Prestashop ou Drupal, il existe des plugins qui génèrent très facilement votre sitemap et vous permettent de le télécharger dans Google Search Console.

Générer un sitemap sur WordPress avec Yoast SEO

La création d'un sitemap avec le plugin Yoast SEO est rapide et intuitive :

- Téléchargez, installez et activez le plugin Yoast SEO (Plugins ajouter nouveau).
- Dans le menu de gauche de WordPress, allez dans SEO General et sélectionnez l'onglet Features
- Faites défiler vers le bas jusqu'à XML sitemaps et activez le sitemap. Sauvegardez.

Si vous souhaitez uniquement générer un sitemap standard, vous n'avez rien d'autre à faire. Si vous souhaitez le modifier :

Dans le tableau de bord, cliquez sur SEO Search Appearance. Choisissez le type de contenu que vous souhaitez voir apparaître dans votre plan du site en activant ou en désactivant le bouton.

Vous pouvez également exclure des articles ou des pages spécifiques :

- Allez sur la page en question et descendez jusqu'à l'encart Yoast SEO.
- Cliquez sur la petite roue dentée pour modifier les paramètres.
Dans le menu "Autoriser les moteurs de recherche à afficher cette page dans leurs résultats de recherche", sélectionnez "non" et enregistrez.

NB : attention aux conséquences de cette manipulation, qui doivent être réfléchies en amont. D'une manière générale, il est recommandé d'exclure les pages telles que les mentions légales qui n'ont pas vocation à être indexées.

Générer un sitemap sur Prestashop

Google Sitemap est le module gratuit le plus utilisé pour générer un sitemap sur Prestashop. Il peut être téléchargé sur Github.

Dans le panneau d'administration Modules et services, tapez gsitemap.

Une fois installé, cliquez sur "Configurer", vous obtiendrez un formulaire dans lequel vous devrez indiquer la fréquence moyenne de mise à jour de votre commerce en ligne. Le module prendra en compte chaque modification pour rafraîchir le sitemap.

Les cases à cocher suivantes proposées dans le formulaire permettent d'exclure certaines pages lors de la génération du sitemap. Comme avec Yoast SEO sur WP, il est recommandé de ne cocher que les pages qui n'ont pas d'intérêt en termes de référencement : panier d'achat, compte client, historique des commandes, informations légales, etc.

Une fois vos pages sélectionnées, cliquez sur le bouton "Générer le plan du site". Il faut compter quelques minutes avant la finalisation du sitemap.

Générer un sitemap sur Drupal

Le module Views est une méthode rapide mais un peu plus complexe pour générer un sitemap sur Drupal. Il vous suffit de

Créer la vue avec les éléments que vous voulez voir dans le sitemap ; puis dans les options de pagination, sélectionner les options de pagination et sélectionner "Afficher tous les éléments".

Configurer la sortie en XML en allant dans Format Document de données XML. Dans la page de paramètres qui s'affiche, spécifiez

- urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9″ dans le champ Nom de l'élément racine URL dans le champ - Nom de l'élément enfant de premier niveauAppliquer les modifications

Attention, il faut penser à modifier le chemin dans Page settings dans sitemap.xml.

- Ajoutez le champ Content : path dans "Fields".
- Indiquez loc dans le champ label.
- Dans Rewrite Result cochez la case "Use Absolute link".
- Appliquer.
- Ajoutez ensuite le champ Content : updated date.
- Dans le champ " label ", indiquez " lastmod " puis sélectionnez le format de date personnalisé avec le format suivant : A-m-d
- Appliquer.

Générer un plan du site sur Joomla

Nous recommandons l'extension OSMap Joomla Sitemap qui est la plus populaire et la plus facile à utiliser. Elle peut être téléchargée à partir de la page OSMap.

- Dans votre zone d'administration Extensions Gérer Installer OSMap via le programme d'installation de Joomla.
- Dans Composants OSMap. Vous devriez voir une page avec 2 menus latéraux "Sitemaps" et "Extensions".
- Cliquez sur "Default Site Map" et sélectionnez tous les éléments que vous voulez que les moteurs de recherche trouvent. Sauvegardez. - Cliquez sur "Extension" dans le menu de gauche, puis sur "OSMap - Joomla Content".
- Permettez aux moteurs de recherche de trouver votre plan de site Joomla.

Générer un sitemap sur Magento

- Allez dans le panneau d'administration de Magento et accédez à l'onglet Catalogue Google Sitemap.
- Cliquez sur le bouton Ajouter.
Saisissez sitemap.xml dans le champ Nom du fichier. Le champ Chemin définit le répertoire du serveur dans lequel le fichier sitemap.xml sera enregistré. Habituellement, le fichier est enregistré dans le répertoire racine de Magento, dans ce cas, insérez seulement la barre oblique "/" dans le champ.
Dans le champ Store view, sélectionnez le store view pour lequel vous configurez le sitemap. Sauvegarder.

Créer un sitemap XML dans Screaming Frog (Technique utilisée par l'équipe Hustle More 974)

Screaming Frog peut être utilisé pour de nombreuses choses, telles que la recherche d'inlinks et d'outlinks, ou la recherche d'un texte alt img manquant. Dans cet article, nous allons voir comment créer un sitemap XML dans Screaming Frog. - Effectuez un crawl de votre site ou d'une liste d'URL
Une fois le crawl terminé, accédez à "Sitemaps" et sélectionnez "XML Sitemap" :

- Vous obtenez alors une série d'options de configuration sur différents onglets. Le premier d'entre eux est "Pages". Par défaut, le sitemap XML n'inclura que les URL HTML 2xx indexables. Il est probable que vous ne souhaitiez pas modifier ces paramètres. La présence de pages 404, par exemple, dans un sitemap XML est une mauvaise pratique :

- L'onglet "Dernière modification" vous permet de modifier ou d'exclure la balise "lastmod". Il ne s'agit pas d'une balise particulièrement importante à configurer dans un sitemap XML, et Google a précédemment déclaré qu'il ignorait généralement la balise lastmod dans les sitemaps XML.

- Viennent ensuite les onglets "Priorité" et "Fréquence de modification". Là encore, Google a minimisé le rôle de ces fonctionnalités, mais vous pouvez toujours les modifier si vous le souhaitez à l'aide des paramètres de Screaming Frog indiqués ci-dessous (si vous n'êtes pas sûr de vous, il vaut mieux ne pas les modifier) :

- L'onglet "Images" est plus important. Par défaut, les paramètres n'incluent pas les images, mais selon la façon dont vos sitemaps sont organisés (par exemple, si vous avez un sitemap d'images séparé, ou si vous ne pouvez pas faire tenir toutes vos images et URL HTML dans un sitemap (il y a une limite de 50 000 URL)), vous voudrez peut-être les inclure. Après tout, cela pourrait aider vos images à apparaître dans la recherche d'images de Google. Si vous avez des images qui sont hébergées en dehors de votre domaine sur des réseaux de diffusion de contenu (Content Delivery Networks), vous pouvez également les saisir manuellement dans la case de cet onglet.

- Enfin, il y a l'onglet Hreflang. Si vous avez un site international qui utilise des liens hreflang, vous pouvez cocher cette case pour que leurs éléments soient également inclus.

Une fois que vous avez sélectionné vos options dans la configuration de l'exportation, cliquez sur OK et Screaming Frog générera votre sitemap XML !

Configurer le sitemap dans Google Search Console

Une fois que vous avez généré votre sitemap sur votre CMS, il est important de l'importer sur votre compte Google Search Console afin qu'il soit correctement pris en compte. L'importation du sitemap est très rapide :

- Connectez-vous à Google Search Console.
- Sélectionnez le site web concerné.
- Développez la section "Index", puis cliquez sur "Sitemaps".
- Saisissez sitemap_index.xml dans la zone de texte qui s'affiche.
- Cliquez sur Envoyer.
Et c'est tout ! Bien entendu, si votre sitemap change régulièrement, pensez à le mettre à jour dans le SGC.

Erreurs courantes lors de la génération du sitemap

Mauvais protocole utilisé

Il arrive que le sitemap n'utilise pas le format d'URL. Par exemple, il n'inclut pas "www" ou affiche "HTTP" au lieu de "HTTPS". Si vous avez récemment modifié le format d'URL, il se peut que vous ayez mal formaté les URL ou que vous ayez oublié de mettre à jour le plan du site (surtout si vous n'utilisez pas un système de gestion de contenu interne).

Mauvaise application des règles de réécriture

Lorsque le plan du site ne fonctionne pas sur un serveur Apache ou Nginx, il est très probable qu'il y ait une erreur dans l'implémentation des règles d'écriture. Intégration d'URLs interdites à l'indexation Parfois, sans s'en rendre compte, on génère un sitemap contenant des URLs bloquées dans le fichier robots.txt. Or, en règle générale, Google signale ce type d'erreur. Cela peut également vous permettre de vous rendre compte d'éventuelles erreurs dans votre fichier robots.txt.

Plan du site non segmenté

A la base, le fichier sitemap.xml impose un nombre limité correspondant à 50.000 URL au maximum. Les gros sites sont donc parfois dans l'obligation de segmenter leur fichier en plusieurs sitemaps pour passer sous cette limite. Mais cette segmentation est également importante pour la gestion du sitemap et tout simplement pour s'y retrouver ! La clé est de structurer vos sitemaps en fonction de la profondeur de vos pages et par catégorie, afin de mieux diagnostiquer certains problèmes, surtout si votre site est multilingue.

Conclusion

Même si cela ne conditionne pas directement le succès de votre site, prendre le temps de construire un sitemap cohérent est nécessaire pour améliorer l'exploration de vos pages par les différents moteurs de recherche. En leur facilitant l'accès à certaines pages profondes, vous mettrez toutes les chances de votre côté pour les voir un jour indexées dans les SERP.

Contactez un expert

Réponse sous 24hrs