www.page-rank.bz webmas.ca

WEBMAS.CAPlus qu’une site, une référence internet!
Nous vous offrons les secrets d'une bonne indexation,
Grace à notre site, vous serez en mesure de vous positionnez dans les
moteur de recherche .

Marc Gendron Webmestre  
4143483 pages affichées

Accueil

Conception visuelle

L'importance du code HTML 

Les Noms de domaines 

Fureteur et compatibilité 

La balise DOCTYPE

La balise META 

Référencement

keysword densite

Site map 

Robot

Trust Rank

information

Algorithme HITS

Spamdexing

Netlinking

flux RSS

backlinks

Co-browsing

Referencement

PageShare

Google Sandbox 

Google PageRank

site-ranks

 

Webmaster contact

 

 

www.sitemaps.bz

L'importance du code HTML dans vos pages web

B

Sitemap


Un article de Wikipédia, l'encyclopédie libre.

Aller à : Navigation, Rechercher
Un site map est, littéralement en anglais, une « carte d'un site ». C'est en réalité une liste des ressources proposées sur un site web. Outre la possibilité pour l'internaute d'accéder rapidement à l'ensemble des documents proposés sur le site, une carte/plan de site permet à d'autres utilisateurs (moteurs de recherche) de lister l'ensemble des documents au lieu de les crawler. Généralement rédigé en XML, il permet aux moteurs de recherches de parcourir plus facilement des sites Web, par exemple pour ceux qui n'ont pas de liens en HTML (sites web en Flash ou en JavaScript par exemple).
Google, Yahoo et Live Search, Ask.com et Exalead utilisent les sitemaps, afin que le robot des moteurs de recherche y trouve aisément les pages à indexer.


Sommaire
[masquer]

Format XML et texte
Un format commun a été adopté par Google, Yahoo, Live Search de Microsoft, Ask.com et Exalead, basé sur le format de Google. Un site a aussi été créé pour donner des informations sur ce format.
Google accepte deux formats pour les sitemaps qui lui sont soumises : XML et texte. Le format de fichier texte est une simple liste des pages avec une URL complète, protocole "http://" inclus. Le fichier XML standard comporte outre l'URL :

  • une périodicité pour scanner la page,
  • la date de dernière mise à jour,
  • l'importance relative de la page par rapport aux autres pages du site.

Une fois la carte de site enregistrée auprès de Google, vous obtenez des statistiques quand aux recherches sur le moteur qui aboutissent à vos pages.
Tous les moteurs de recherche ne proposant pas d'interface pour soumettre cette liste à leur index, une autre méthode consiste à ajouter le chemin vers le sitemap dans le fichier robots.txt via la syntaxe : Sitemap: http://www.example.org/sitemap.xml.
Interfaces d'administration des sitemaps [modifier]

Format HTML [modifier]
Il est aussi possible de créer une sitemap en HTML. Elle ne doit pas être soumise à Google mais être liée sur la page d'accueil du site. Elle est surtout destinée aux internautes.
Références [modifier]

Récupérée de « http://fr.wikipedia.org/wiki/Sitemap »

 

Quels sont Sitemaps?

Sitemaps are an easy way for webmasters to inform search engines about pages on their sites that are available for crawling. Sitemaps sont un moyen facile pour les webmasters à informer les moteurs de recherche sur les pages de leurs sites qui sont disponibles pour l'exploration. In its simplest form, a Sitemap is an XML file that lists URLs for a site along with additional metadata about each URL (when it was last updated, how often it usually changes, and how important it is, relative to other URLs in the site) so that search engines can more intelligently crawl the site. Dans sa forme la plus simple, un plan Sitemap est un fichier XML qui répertorie les URL d'un site ainsi que des métadonnées complémentaires sur chaque URL (date de dernière mise à jour, combien de fois les changements d'habitude, et combien il est important, par rapport aux autres URL du site ), De sorte que les moteurs de recherche peut favoriser une exploration plus intelligente du site.
Web crawlers usually discover pages from links within the site and from other sites. Robots d'exploration du Web en général découvrir des pages de liens dans le site et d'autres sites. Sitemaps supplement this data to allow crawlers that support Sitemaps to pick up all URLs in the Sitemap and learn about those URLs using the associated metadata. Sitemaps compléter ces données pour permettre aux robots d'exploration à l'appui des plans Sitemap pour ramasser toutes les URL dans le plan Sitemap et en apprendre davantage sur ces URL en utilisant les métadonnées associées. Using the Sitemap protocol does not guarantee that web pages are included in search engines, but provides hints for web crawlers to do a better job of crawling your site. Utilisation du protocole Sitemap ne garantit pas que les pages Web sont inclus dans les moteurs de recherche, mais permet de fournir des indications pour les robots d'exploration du Web de faire un meilleur travail de l'exploration de votre site.

Plan du site 0,90 est offerte dans le cadre de l'Attribution-ShareAlike Creative Commons License et dispose d'un large adoption, y compris le soutien de Google, Yahoo!, Et Microsoft.

 

Sitemaps format XML
Aller à:
Définitions des balises XML
D'échappement d'entité
Utilisation de fichiers d'index Sitemap
Emplacement du fichier Sitemap
Validation de votre plan Sitemap
Extension du protocole Sitemap
Moteur de recherche au service des robots d'exploration

Ce document décrit le schéma XML pour le protocole Sitemap.
The Sitemap protocol format consists of XML tags. Le protocole Sitemap présente sous la forme de balises XML. All data values in a Sitemap must be . Toutes les valeurs de données d'un plan Sitemap doit être l'entité la fuite. The file itself must be UTF-8 encoded. Le fichier lui-même doit être encodé en UTF-8.
The Sitemap must: Le plan Sitemap doit:

  • Begin with an opening < > tag and end with a closing </urlset> tag. Commencez par une ouverture <urlset> balise et se terminent par une fermeture </ urlset> tag.
  • Specify the namespace (protocol standard) within the <urlset> tag. Spécifiez l'espace de nom (standard de protocole) dans le <urlset> tag.
  • Include a < > entry for each URL, as a parent XML tag. Inclure un <url> entrée pour chaque URL, comme une balise XML parent.
  • Include a < > child entry for each <url> parent tag. Inclure un <loc> enfant entrée pour chaque balise parent <url>.

All other tags are optional. Toutes les autres balises sont facultatives. Support for these optional tags may vary among search engines. Le soutien à ces balises mai facultatif varient selon les moteurs de recherche. Refer to each search engine's documentation for details. Reportez-vous à chaque moteur de recherche de documentation pour les détails.
Also, all URLs in a Sitemap must be from a single host, such as www.example.com or store.example.com. Aussi, toutes les URL dans un plan Sitemap doit être d'un seul hôte, comme www.example.com ou store.example.com. For further details, refer the Pour plus de détails, reportez-l'emplacement du fichier Sitemap

Sample XML Sitemap Exemple de plan Sitemap XML

RANKING-1.COMMy Google Pagerank

Attribute Attributs

Description

<urlset>

nécessaire

Encadre le fichier et référence le standard de protocole actuel.

<url>

nécessaire

Balise parent de chaque entrée d'URL. Les autres balises sont des enfants de cette balise.

<loc>

nécessaire

URL de la page. Cette URL doit commencer par le protocole (http, par exemple) et se terminer par une barre oblique, si votre serveur Web l'exige. Cette valeur doit être inférieure à 2048 caractères.

<lastmod>

facultatif

La date de dernière modification du fichier. Cette date doit être au format Ce format vous permet d'omettre l'heure, si vous le souhaitez, et de n'utiliser que le format AAAA-MM-JJ.
Notez que cette balise est distinct du If-Modified-Since (304)-tête le serveur peut renvoyer, et les moteurs de recherche mai utiliser les informations provenant des deux sources différentes.

<changefreq>

facultatif

Quelle est la fréquence la page est susceptible de changer. This value provides general information to search engines and may not correlate exactly to how often they crawl the page. Cette valeur fournit des renseignements généraux aux moteurs de recherche et mai corrélation pas exactement à quelle fréquence effective d'exploration de la page. Valid values are: Les valeurs acceptées sont les suivantes:

  • always toujours
  • hourly horaire
  • daily tous les jours
  • weekly hebdomadaire
  • monthly mensuel
  • yearly annuel
  • never jamais

La valeur «toujours» devrait être utilisée pour décrire les documents qui changent à chaque fois qu'ils sont accessibles. La valeur «jamais» doit être utilisée pour décrire les URL archivées.
S’il vous plaît noter que la valeur de cette balise est considérée comme une indication et non d'une commande. Même si les robots des moteurs de recherche mai examiner ces informations lors de la prise de décisions, ils mai explore des pages à la mention "horaire" moins souvent que cela, et ils mai exploration pages marquées "chaque année" plus souvent que cela. Robots d'exploration mai périodiquement pages marquées «jamais» de façon à traiter des changements inattendus à ces pages.

<priority>

facultatif

The priority of this URL relative to other URLs on your site. Priorité de cette URL par rapport aux autres URL de votre site. Valid values range from 0.0 to 1.0. Les valeurs vont de 0,0 à 1,0. This value does not affect how your pages are compared to pages on other sites—it only lets the search engines know which pages you deem most important for the crawlers. Cette valeur n'a pas d'incidence sur la façon dont vos pages sont comparées avec les pages d'autres sites-il seulement permet aux moteurs de recherche les pages que vous jugez les plus importantes pour les robots d'exploration.
S’il vous plaît noter que la priorité attribuée à une page n'est pas de nature à influencer la position de votre URL dans un moteur de recherche les pages de résultats. Mai moteurs de recherche utilisent ces informations lors de la sélection entre les URL sur le même site, afin que vous puissiez utiliser cette balise afin d'augmenter la probabilité que votre plus important sont les pages présentes dans un index de recherche.
Aussi, s’il vous plaît noter que l'attribution d'une priorité élevée à toutes les URL de votre site n'est pas susceptible de vous aider. Comme la priorité est relative, il est seulement utilisé pour choisir entre URL de votre site.

1

608895