XML (classique) | Le protocole de ce type de Sitemap se compose de balises "XML". Il doit impérativement: - Être encodé en "UTF-8".
- Commencer par la balise d´ouverture <urlset> et se terminer par la balise de fin </urlset>.
- Spécifier le standard de protocole dans la balise <urlset>.
- Inclure pour CHAQUE URL une entrée <url> (XML-parent-tag).
- Inclure <loc> pour chaque balise parent <url> (XML-child-tag).
Toutes les autres balises sont purement facultatives. La prise en charge dépend du moteur de recherche. Pour plus d´information reportez-vous à la documentation respective. Voici ci-suivant un exemple typique de sitemap: <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.exemple.com/index.html</loc> <lastmod>2009-02-01</lastmod> <changefreq>monthly</changefreq> <priority>1.0</priority> </url> <url> <loc>http://www.exemple.com/page1.html</loc> <lastmod>2009-02-01</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> <url> </url> <loc>http://www.exemple.com/page2.php</loc> <lastmod>2009-02-01</lastmod> <changefreq>daily</changefreq> <priority>0.5</priority> </url> </urlset> | Indexed (Cascade) | Ce type de Sitemap aura pour contenu un ensemble d'autres sitemaps. il y a pour cela plusieurs cas de figures: - Un site polyglotte dont la langue est automatiquement chargée suivant la langue configurée dans le navigateur du visiteur. Les spiders étant en anglais par défaut, sans ce sitemap il ne voient que les pages en anglais.
- Un Sitemap ne doit pas dépasser le nombre de 50.000 pages.
Sur un site ayant plus de pages il sera nécessaire de diviser le contingent et le répartir sur plusieurs sitemaps qui eux seront référencés par le sitemap initial. - Un Sitemap ne doit pas dépasser un volume de 10 mégaoctets.
Le cas échéant voir plus haut. Le format XML d'un fichier d'index Sitemap est très similaire au format XML d'un fichier Sitemap. Il doit impérativement: - Être encodé en "UTF-8".
- Commencer par la balise d´ouverture <sitemapindex> et se terminer par la balise de fin </sitemapindex>.
- Spécifier le standard de protocole dans la balise <sitemapindex>.
- Inclure pour CHAQUE Sitemap une entrée <sitemap> (XML-parent-tag).
- Inclure <loc> pour chaque balise parent <sitemap> (XML-child-tag).
Toutes les autres balises sont purement facultatives. La prise en charge dépend du moteur de recherche. Pour plus d´information reportez-vous à la documentation respective. Un fichier de Sitemap Indexed ne peut que comporter un ensemble de sitemaps situé sur le site lui-même! Voici ci-suivant un exemple typique de sitemap pour sites polyglottes: <?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.exemple.com/sitemap_en.xml</loc> <lastmod>2009-02-01</lastmod> <priority>0.5</priority> </sitemap> <sitemap> <loc>http://www.exemple.com/sitemap_fr.xml</loc> <lastmod>2009-02-01</lastmod> <priority>0.5</priority> </sitemap> <sitemap> <loc>http://www.exemple.com/sitemap_de.xml</loc> <lastmod>2009-02-01</lastmod> <priority>0.5</priority> </sitemap> </sitemapindex> | RSS (ROR) | Le format RSS est celui qui a connu la plus grande évolution des derniers temps! Qu´est-ce que le RSS? Avez-vous remarqué le boutton RSS sur votre site favori? En simples termes, RSS ("Really Simple Syndication" ou "Rich Site Summary") est un moyen de vous faire savoir ce qu´il y a de nouveau sur multiples sites, tout sur un seul lien et mis à jour automatiquement. Le Flux RSS est un peu comme un abonnement à différents magazines, tout en choisissant vos thèmes favoris de chacun, mais tous au même endroit. Et le meilleur est que c´est gratuit! Maintenant à vous de proposer cet abonnement pour VOTRE site à VOS visiteurs! (il existe cependant différents types de fichiers RSS (RSS 0.91, 1.0, 2.0 ou ATOM 0.3 ou 1.0) pour plus de simplicité nous limiterons au format RSS 2.0 comme recommandé par RORWEB.COM)) Le Flux RSS informera vos visiteurs abonnés sur vos nouveautés, leurs descriptions, leurs mots clé etc. Ce format doit impérativement: - Être encodé en "UTF-8".
- Commencer par la balise d´ouverture <rss> et se terminer par la balise de fin </rss>.
- Spécifier le standard de protocole dans la balise <rss>.
- suivit d´une entrée <channel> (XML-parent-tag du Flux).
- suivit du titre du Flux <title>Titre de la page</title>.
- suivit du lien de la page pricipale du site <link>http://www.exemple.com/</link>.
- inclure au moins un <item>.
- Entourées par <item> et </item> (XML-parent-tag de la page)
- d´abord le tire de la page <title>Titre de la page</title>
- et le lien de la page <link>http://www.exemple.com/index.html</link>
Toutes les autres balises sont purement facultatives. Voici ci-suivant un exemple typique de Flux RSS: <?xml version="1.0" encoding="UTF-8"?> <rss version="2.0" xmlns:ror="http://rorweb.com/0.1/"> <channel> <title>Flux du site exemple.com</title> <link>http://www.exemple.com/</link> <item> <title>Ceci est la première page</title> <link>http://www.exemple.com/index.html</link> <description>le contenu de la balise META "description"</description> <ror:type>Main</ror:type> <ror:keywords>le contenu de la balise META "keywords" de la page</ror:keywords> <ror:updated>2009-03-06 13:03:30</ror:updated> <ror:updatePeriod>day</ror:updatePeriod> </item> <item> <title>Notre Cataloque</title> <link>http://www.exemple.com/catalog.html</link> <description>Visitez notre boutique en ligne</description> <ror:updatePeriod>day</ror:updatePeriod> <ror:sortOrder>0</ror:sortOrder> <ror:resourceOf>sitemap</ror:resourceOf> </item> <item> <title>Nos Conditions de vente</title> <link>http://www.exemple.com/conditions.html</link> <description>Ci-suivant nos conditions de vente</description> <ror:updatePeriod>year</ror:updatePeriod> <ror:sortOrder>0</ror:sortOrder> <ror:resourceOf>sitemap</ror:resourceOf> </item> </channel> </rss> | HTML | Ce "Sitemap" n´a en fait que le nom en commun avec les autres. Il n´entre pas dans la famille des XML! Admettons que vous avez sur votre site un menu javascript pour laisser naviguer les visiteurs. Cependant les navigateurs utilisés ne pourront peut-être pas interpréter votre code. Ou prenons le cas d´un menu Flash. Il nécessite l´installation du Plug-In respectif. Ce qui est d´ailleur le cas pour tout autre type de constellation du genre. Bref, quels que soient vos efforts, vous n'arriverez jamais à satisfaire 100% des navigateurs et vos visiteurs seront limités à votre page d´acceuil, vu que le menu initial contenant les liens nécessaires n´est pas interprété!
A moins que .............. vous créez un fichier purement HTML qui contiendra toutes les pages de votre site que vous voulez voir visitées. Ce Sitemap ne sera en fait rien d´autre qu´un Plan de votre site, d´où le nom "Sitemap". Le protocole de ce genre de sitemap n´est rien d´autre que du pure est simple code HTML, tel que vous le connaissez. Ci-suivant un exemple typique d´un Sitemap HTML: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xml:lang="fr" lang="fr" xmlns="http://www.w3.org/1999/xhtml"> <body> <a href="http://www.exemple.com/index.html" title="Site exemple.com"> Page d´acceuil du site exemple.com </a> <a href="http://www.exemple.com/boutique.html" title="Boutique du site exemple.com"> La Boutique </a> <a href="http://www.exemple.com/catalogue.html" title="Catalogue du site exemple.com"> Notre Catalogue </a> </body> </html> | Texte (Définitions) | Le Sitemap Texte est celui qui n´a absolument vraiment rien à voir avec les précédents. Il est ni de l´HTML ou de l´XML. La raison d´être du fichier sitemap.txt est soit d´avoir un contrôle pour le webmestre du site sur quelles pages sont présentes sur le site, ou bien il peut être soumis au moteur de recherches Yahoo! qui lui pourra interpréter ce fichier en temps que sitemap. Le protocole du sitemap Texte est inexistant, si ce n´est de créer un fichier texte avec votre éditeur de texte préférré (Word et Wordpad sont à éviter) et de saisir les URLs concernées, ce faisant il n´y aura qu´une seule URL par ligne. Ci suivant un fichier sitemap.txt typique: http://www.exemple.com/index.html http://www.exemple.com/boutique.html http://www.exemple.com/catalogue.html | |