Expériences sur des mots clés, underscores ou tirets
Séparer des mots par des underscores ou leur préférer leur cousins les traits d’union, est une question qui s’impose souvent lors de l’étape de référencement de son site… Chacun y va de son article ou de ses déductions.
Le nombre impressionnant de réponses au lancement d’une requête du type « tiret ou underscore » dans un moteur de recherche, nous indique combien ce sujet préoccupe les concepteurs de site Internet.
En 2005, Matt Cutts publiait sur son blog le célèbre article Dash vs. underscores dans lequel il annonçait la non-reconnaissance du caractère « _ » en tant que séparateur de mots par Google. En 2007 lors de la WordCamp, le même Matt Cutts aurait annoncé que les undescores seraient dorénavant considérés comme des séparateurs.
Qu’en est-il réellement aujourd’hui ?
Et bien, le plus simple reste de tester et de vérifier en direct par nous-même. Pour cela, employons dans cet article, toute une série de mots du type « clitchenkoustock » et autres originalités n’ayant jamais eu l’immense privilège d’être acceptées dans la langue française et autres langues étrangères, quel qu’elles soient.
Assurons-nous, tout d’abord, que les moteurs ne connaissent pas déjà ces mots, tout simplement en lançant une requête (Seulement Google et Bing ont été utilisés pour ces tests). Plaçons ensuite ces mots dans le texte de l’article, en utilisant ou non des underscores et autre tirets.
Profitons-en également pour pousser le test sur des coquilles utilisant Flash, ainsi qu’au travers d’une série de liens pointants vers divers formats de fichiers souvent utilisés comme pièces annexes au contenu du site.
Une fois tout ceci en place, il ne nous reste plus alors qu’à laisser mijoter quelques temps en attendant la visite de quelques bots, puis à lançer à nouveau une requête depuis les mêmes moteurs de recherche afin de vérifier si cette fois, la pêche est bonne…
Vérifions le référencement de la page sur clitchenkoustock
Avant de vérifier si les moteurs captent ou non certaines subtilités de séparation de mot par des underscores ou des tirets, il faut déjà s’assurer que le simple mot clitchenkoustock a été récupéré et qu’il existe dorénavant sur Google et sur Bing.
Si la requête génère un résultat, c’est que le mot se trouve dans la base de données du ou des moteurs. Dans ce cas uniquement, cela veut dire que la page a bien été visitée et mémorisée, et que nous allons pouvoir aller plus loin dans nos investigations. Vérifions donc les compositions de mots, les liens vers les documents liés, ou encore l’intégration au sein des coquilles Flash comme nous l’explorerons au cours des prochains chapitres.
vlentchakourik-poustagourito et hourtyenkopal_gloutchbooga
Voici dans le titre de ce paragraphe, deux groupes de mots, l’un utilisant un tiret (vlentchakourik-poustagourito), l’autre un underscore (hourtyenkopal_gloutchbooga). Afin d’être plus précis, nous symboliserons le premier groupe par A-B et le second par C_D. Si, lors du test précédent sur clitchenkoustock la requête est fructueuse, elle devrait l’être également pour les deux groupes.
Du moins en utilisant les groupes de manière complète. C’est à dire en tapant soit la paire A-B, soit la paire C_D dans un moteur de recherche. Vous pouvez utiliser les liens préformatés, ici sur Google et là sur Bing pour le premier groupe, et ici sur Google et là sur Bing pour le second groupe.
Cette première phase de recherche sur les paires globales validée, essayons de voir ce qu’il en ressort en testant chaque mot de manière indépendante. C’est-à-dire que si les moteurs de recherche reconnaissent bien le tiret et l’underscore comme étant des séparateurs de mots, chaque mot devrait pouvoir être reconnu de manière indépendante par les moteurs de recherche.
Ainsi, les mots A, B, C et D devraient pouvoir être reconnus.
Toujours dans le but de rester dans des conditions de test optimales, les mots ne sont pas saisis de manière isolée, et ce, que cela soit dans le texte de l’article ou dans de quelconques liens pré-configurés. Il vous faut donc les copier-coller ou les saisir directement dans le moteur de recherche.
Du texte, il y en a aussi dans les URLs optimisées
De la même manière, des tests peuvent être conduits sur l’utilisation d’underscores ou de tirets comme caractères séparateurs dans les URLs optimisées. L’extension utilisée pour l’URL Rewriting du site de Puce et Média, sh404sef, propose de définir de manière générale un seul et unique caractère de remplacement souhaité.
Il est possible d’utiliser le tiret, l’underscore ou tout autre caractère de notre choix… Actuellement le caractère choisi est le ‘-‘. Changer ce caractère, le changerait pour l’intégralité du site. Ce n’est pas une opération souhaitée, afin de ne pas perturber la gestion des liens et du référencement en cours.
Par ailleurs, de manière automatique, le caractère « _ » n’est pas reconnu par certains types de plateformes, notamment Joomla, et si le titre d’un article l’utilise, il est omis de l’adresse lors de la génération de l’URL basée sur le titre de l’article.
De ce fait, pour mener à bien cette expérience, le plus simple reste de faire appel à des pages externes et statiques. Nous allons placer des liens sortants vers ces pages en créant des URL enrichies en mots-clés, une première utilisant l’underscore et une seconde utilisant le tiret. Vous pourrez en déduire les mots-clés en cliquant sur les liens et en consultant l’URL.