//
you're reading...
Google, Réseau, SEO

Tout savoir sur meta name = « robots »


Balise-meta-name-robot

Longtemps adulés par les référenceurs du début des années 2010, elles sont aujourd’hui souvent délaissés alors qu’elles jouent encore un rôle influant. Les moteurs de recherche leur ont peu à peu ajoutés diverses fonctionnalités. Cette page répertorie une vue d’ensemble de toutes les différentes valeurs que vous pouvez avoir. Tout d’abord, la syntaxe officielle:

<meta name="robots" value=" <value> "

Les différentes valeurs des balises meta robots

Ci-dessous une explication des valeurs que vous pouvez utiliser dans vos balises meta robots:

<meta name= »description » content= »Une description de la page » /> Cette balise fournit une brève description de la page. Dans certains cas, cette description est incluse dans l’extrait qui s’affiche avec les résultats de recherche.Plus d’informations
<title>Le titre de la page</title> Bien que cette balise ne soit pas réellement une balise META, elle est souvent utilisée conjointement avec la « description ». Le contenu de cette balise est généralement affiché comme titre dans les résultats de recherche (et bien sûr dans le navigateur des internautes). Plus d’informations
<meta name= »robots » content= »…, … » />
<meta name= »googlebot » content= »…, … » />
Ces balises META permettent de contrôler l’exploration et l’indexation effectuées par les moteurs de recherche. La balise META robots concerne tous les moteurs de recherche. En revanche, la balise META « googlebot » est spécifique à Google. Les valeurs par défaut sont « index, follow » (équivalent à « tous ») et il n’est donc pas nécessaire de les spécifier. Nous prenons en charge les valeurs suivantes (si vous insérez plusieurs valeurs, séparez-les par des virgules) :

  • noindex : empêche l’indexation de la page.
  • nofollow : empêche le robot Googlebot de suivre les liens de cette page.
  • nosnippet : empêche l’affichage d’un extrait dans les résultats de recherche.
  • noodp : empêche l’utilisation d’une description de remplacement tirée des sites ODP/DMOZ.
  • noarchive : empêche Google d’afficher le lien En cache associé à une page.
  • unavailable_after:[date] : permet de préciser l’heure et la date exactes auxquelles l’exploration et l’indexation de cette page doivent cesser.
  • noimageindex : permet d’indiquer que vous ne souhaitez pas faire apparaître votre page comme source d’une image apparaissant dans les résultats de recherche Google.

Désormais, vous pouvez également spécifier ces informations dans l’en-tête de vos pages à l’aide de l’instruction d’en-tête HTTP « X-Robots-Tag ». Cette instruction est particulièrement utile pour limiter l’indexation de fichiers non HTML comme les images ou d’autres types de documents. En savoir plus sur le fichier robots.txt

<meta name= »google » content= »notranslate » /> Lorsque le contenu d’une page n’est pas dans la langue choisie par l’utilisateur, nous fournissons généralement dans les résultats de recherche un lien permettant d’accéder à une traduction. Vous pourrez ainsi proposer votre contenu à une plus large gamme d’utilisateurs. Toutefois, cela peut ne pas être souhaitable dans certains cas. Avec cette balise Meta, vous interdisez à Google de fournir une traduction de votre page.
<meta name= »google-site-verification » content= »… » /> Utilisez cette balise sur la page de plus haut niveau de votre site afin de confirmer que vous en êtes propriétaire dans le cadre des Outils pour les webmasters. Notez que les valeurs des attributs « name » et « content » (y compris majuscules et minuscules) doivent correspondre exactement à l’élément fourni. Cependant, vous pouvez remplacer la balise XHTML par HTML ou utiliser un format de balise adapté à votre page. Cela n’a aucune importance. En savoir plus
<meta http-equiv= »Content-Type » content= »…; charset=… » /> Cette balise META définit le type de contenu de la page ainsi que le jeu de caractères. Veillez à insérer la valeur de l’attribut de contenu entre des guillemets droits. Dans le cas contraire, l’attribut charset pourrait être interprété de manière inappropriée. Plus d’informations
<meta http-equiv= »refresh » content= »…;url=… » /> Cette balise META renvoie l’utilisateur vers une autre URL après un certain temps. Elle est parfois utilisée comme une simple redirection. Toutefois, elle n’est pas prise en charge par tous les navigateurs et peut induire en erreur les utilisateurs. Le W3C conseille de ne pas l’utiliser. Nous vous recommandons plutôt l’utilisation d’une redirection 301 côté serveur.

Autres éléments à connaître :

  • Google prend en charge les balises META de types HTML et XHTML, quel que soit le code utilisé sur la page.
  • À l’exception de « verify », vous n’avez pas besoin, d’une manière générale, de respecter la casse pour les balises META.

Cette liste de balises META n’est pas exhaustive. N’hésitez pas à insérer des balises META non répertoriées ici pour les besoins de votre site. Sachez simplement que Google ignorera les balises qu’il ne reconnaît pas.

Utilisation des Tags de Schema.org

Il n’y a pas de règle unique. On sait maintenant que le futur du web est sémantiqueet que les tags mis à notre disposition par les moteurs permettent une meilleure compréhension et souvent un affichage plus attrayant des résultats (rich snipet). Mes préférés restent les tags entreprise, personnes et avis, produits et reviews qui influent directement sur le positionnement.

Une utilisation extraordinaire en référencement reste le balisage du catalogue produit pour échange standard avec partenaires et revendeurs, d’où la possibilité de drainer l’autorité et garder la main sur la source officielle (certaines marques se font devancer par leurs affiliés !). Et puis mentionnons quand même que le gain en trafic naturel de Best Buy de l’ordre de 30%, après avoir implanté la solution Good Relations est vraiment motivant.

Ce tableau indique par moteurs de recherche les valeurs supportés :

Robots value Google Yahoo! MSN / Live Ask
index Oui Oui Oui Oui
noindex Oui Oui Oui Oui
none Yes Doute Doute Oui
follow Oui Doute Doute Oui
nofollow Oui Oui Oui Oui
noarchive Oui Oui Oui Oui
nosnippet Oui Non Non Non
noodp Oui Oui Oui Non
noydir inutile Oui inutile inutile

Vous pouvez bloquer l’ensemble des robots à la fois par le balisage ci-dessus, ou tout simplement bloquer  spécifiquement un robot :

  • Google : GOOGLEBOT
  • Yahoo! : SLURP
  • MSN / Live : MSNBOT
  • Ask : TEOMA

À propos de ADNxtc

Charles Parent on the wave since 1996. Topics: SEO, Digital Marketing, Graphic Design, Culture, Architecture, Museum, Education, Webmarketing, Social Networks. Bio: http://charlesparent.net from Nantes (FR)

Discussion

Pas encore de commentaire.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

TWITTER

Flickr Photos

Google Fail error 414

mb3DEngine-_RSS-in-3D

sigir06-poster

bnf_grey_responsable_map

FlickrVision3D

FlickrVision

Plus de photos
%d blogueurs aiment cette page :