PARTAGER

Les sitemaps sont des éléments qui peuvent apporter un petit plus pour le référencement naturel de votre site. On trouve assez facilement des plugins bien fait pour réaliser des sitemaps classiques comme Yooda Map ou des crawlers comme Xenu par exemple.

Comment faire un sitemap ?

 

Sitemap XML

A la différence du sitemap HTML, le sitemap XML est réservé uniquement aux robots.

Il peut contenir une multitude d’informations sur vos pages comme la date de mise à jour, la fréquence de mise à jour, un niveau d’importance etc. Mais nous avons remarqué que ces données ne sont pas forcément respectés par les robots, il est donc préférable de réaliser votre sitemap XML de manière épurée.

Etape n°1 : Parcourez votre site avec un crawler

Cette première étape va nous permettre de récupérer l’ensemble de vos urls présentes dans la structure de votre site. Pour cela vous pouvez utiliser Xenu ou Screaming Frog par exemple. Ces logiciels sont indispensables pour tous les référenceurs, ils permettent de crawler votre site et d’enregistrer pour chaque page les liens pointants vers une autre page, une image, une ressource, une feuille js, un PDF etc.

Une fois le logiciel installé, il suffit de lui indiquer l’adresse de site internet et de démarrer le crawl. Ces informations nous permettront de récupérer toutes les URLs et également URLS des images ainsi que les pages HTML sur lesquels elles sont présentes.

Etape n°2 : Exporter les URLs du logiciel

Une fois que le crawler a terminé l’analyse de votre site, vous pouvez exporter chaque lien d’une URL vers une autre URL grâce à la fonction « Export to GraphViz File… » pour Xenu ou « Bulk export » pour Screaming Frog.

Cela va générer un fichier plus ou moins volumineux en fonction de la taille de votre site. Par exemple, pour un site contenant environ 5000 pages, le fichier généré fait environ 100Mo et un million de lignes.

Chaque ligne du fichier va contenir un lien se trouvant sur le site :

Réaliser un sitemap image grâce à Xenu
Réalisez un sitemap image grâce à Xenu

A gauche se trouve l’URL relative de la page source et à droite se trouve l’URL relative de destination.

On peut constater dans notre exemple que l’on retrouve les URLs des images avec la page sur laquelle elles sont affichées.

Etape n°3 : Filtrer les données pour votre Sitemap

Une fois le fichier récupéré avec l’ensemble des liens, il faut le filtrer pour séparer vos ressources, vos médias et vos urls.

Si votre fichier n’est pas trop volumineux, vous pouvez l’ouvrir sur Excel pour filtrer les données. Mais pour des fichiers de plus d’un million de ligne, il va vous falloir utiliser Linux.

Nous n’allons pas détailler comment faire les filtre sur Excel, les options sont plutôt bien faites.filtres-excel

Vous séparez vos données sur 3 feuilles différentes URLs de votre site / Urls de vos images / URLs de vos vidéos.

Pour Linux, voici par exemple la commande Linux pour garder uniquement les lignes avec des images :

GREP -N « .JPG\|.JPG\|.GIF\|.GIF\|.JPEG\|.JPEG\|.PNG\|.PNG » FICHIER_DE_DEPART.TXT > FICHIER_OK.TXT

Après cette manipulation, votre fichier a normalement fondu et vous pourrez le transférer sur excel pour le mettre aux normes.

Filtrez vos URLs sur Excel
Filtrez vos URLs sur Excel

Vous avez toujours dans la colonne de gauche l’URL de la page source sur laquelle l’image (Url de droite) est affichée.

Sur Excel, vous pouvez en profiter pour supprimer les images accessibles depuis toutes les pages, elle ne sont pas très intéressantes pour le Sitemap.

Composer la structure du Sitemap XML Arborescence

Balise Importance Description
<urlset> Obligatoire Elle englobe le fichier sitemap et référence le standard de protocole utilisé.
<url> Obligatoire Elle représente la balise parent pour chaque URL référencées.
<loc> Obligatoire Elle représente l’URL de la page. Celle-ci doit commencer obligatoirement par l’intitulé du protocole HTTP.
<lastmod> Facultatif Elle informe de la date de la dernière modification du fichier/page.
<changefreq> Facultatif Elle représente la fréquence de modification de la page.
<priority> Facultatif Elle représente la priorité d’une page par rapport aux autres du site.

 

Exemple d’une ligne

<url>
<loc>http://www.xxxxxxxxxxx.it/</loc>
</url>
<url>
<loc>http://www.xxxxxxxxxxx.it/test</loc>
</url>

Composer la structure du Sitemap Image

Balise Importance Description
<image:image> Obligatoire Balise introduisant toutes les informations relatives à une seule image.
<image:loc> Obligatoire Cette balise indique l’url de l’image.
<image:capitation> Facultatif Description de l’image
<image:title> Facultatif Titre de l’image
<image:license> Facultatif url renvoyant à la licence de l’image
<image:geo_location> Facultatif Vous pouvez indiquer ici la situation géographique de l’image

 

Exemple d’une ligne

<image:image>
<image:loc>http://www.xxxxxxxxxxx.it/wp-content/uploads/2012/12/divertirsi-150×100.jpg</image:loc>
</image:image>

Pour vous donner un exemple, vous pouvez télécharger notre fichier Excel.

 

Pour ajouter les balises sur vos lignes, nous utilisons de notre côté la fonction Excel pour concaténer les données.

 

Etape n°4 : Ajouter le code pour déclarer le Sitemap

Enfin, il ne vous reste plus qu’à Copier/Coller votre colonne sur notepad++ ou votre bloc note.

Ajoutez au début de votre fichier l’entête du sitemap à la place du premier « </url> » :

 <?xml version= »1.0″ encoding= »UTF-8″?>
<urlset xmlns= »
http://www.sitemaps.org/schemas/sitemap/0.9″>

Ainsi que cette déclaration pour le sitemap image

<xmlns:image= »
http://www.google.com/schemas/sitemap-image/1.1″>

Et ajoutez à la dernière ligne du fichier :

</url>
</urlset>

Et voila comment faire un sitemap statique ! Vous avez maintenant vos Sitemaps prêts à être utilisés !

A noter que les Sitemaps sont limités à 50 000 urls, veillez à en déclarer plusieurs si votre site dépasse le nombre autorisé.

VN:F [1.9.22_1171]
Avis: 9.5/10 (2 votes)
PARTAGER

14 COMMENTAIRES

  1. On sous-estime trop souvent le potentiel des images pour générer du trafic. Les internautes à utiliser le moteur spécialisé pour ce type de fichiers de Google sont pourtant nombreux. Il est donc important de bien indexer ceux de son ou de ses sites, cela peut valoir le coup. Merci donc pour ces petites astuces 😉

  2. Ah les images que beaucoup de personnes n’optimisent pas (moi compris) et qui peut apporter pas mal de trafic…

    Il en est de même pour les vidéos.
    Merci pour ces conseils qui pourront aider pas mal de webmasters.

    Pour le moment je fais chauffer Xenu pour trouver des nom de domaine libres ^^

  3. A noter que la plupart des CMS (e-commerce ou non) proposent des modules souvent gratuits de sitemap images. Cela permet de gagner du temps sur la construction du sitemap, mais aussi d’avoir un sitemap toujours à jour.
    Et ce n’est pas négligeable.
    A noter aussi l’importance du sitemap vidéo pour des apparitions des vidéos dans les résultats naturels.

    • Entièrement d’accord avec cette remarque, j’utilise aussi plusieurs sitemaps, ce qui permit de rapidement me rendre compte si j’ai un problème d’indexation. Dans Google Webmaster tools, en un clin d’oeil, tu peux voir si ce sont tes fiches produits ou au contraire les pages secondaires qui ne sont pas prises en compte. Paulo

LAISSER UN COMMENTAIRE