Séparer des mots par des underscores ou leur préférer leur cousins les traits d'union est une question qui s'impose souvent lors de l'étape de référencement de son site... Chacun y va de son article ou de ses déductions. Le nombre impressionant de réponses au lancement d'une requête du type "tiret ou underscore" dans un moteur de recherche nous indique combien ce sujet préoccupe les concepteurs de site Internet. En 2005, Matt Cutts publiait sur son blog le célèbre article Dash vs. underscores dans lequel il annonçait la non reconnaissance du caractère "_" en tant que séparateur de mots par Google. En 2007 lors de la WordCamp, le même Matt Cutts aurait annoncé que les undescores seraient dorénavant considérés comme des séparateurs.
Qu'en est il réellement aujourd'hui ?
Et bien, le plus simple reste de tester et de vérifier en direct par nous même. Pour cela employons, dans cet article, toute une série de mots du type "clitchenkoustock" et autres originalités n'ayant jamais eu l'immense privilège d'être acceptée dans la langue française et autres langues étrangères, quelqu'elles soient. Assurons nous, tout d'abord, que les moteurs ne connaissent pas déjà ces mots, tout simplement en lançant une requête (Seulement Google et Bing ont été utilisés pour ces tests). Plaçons ensuite ces mots dans le textede l'article, en utilisant ou non des underscore et autre tiret. Profitons en également pour pousser le test sur des coquilles utilisant Flash, ainsi qu'au travers d'une série de liens pointant vers divers formats de fichiers souvent utilisés comme pièce annexes au contenu du site. Une fois tout ceci en place, il ne nous reste plus alors qu'à laisser mijoter quelques temps en attendant la visite de quelques bots, puis à lançer à nouveau une requête depuis les mêmes moteurs de recherche afin de vérifier si cette fois la pêche est bonne...
Vérifions le référencement de la page sur clitchenkoustock
Avant de vérifier si les moteurs captent ou non certaines subtilités de séparation de mot par des underscores ou des tirets, il faut déjà s'assurer que le simple mot clitchenkoustock a été récupéré et qu'il existe dorénavant sur Google et sur Bing. Si la requête génère un résultat, c'est que le mot se trouve dans la base de données du ou des moteurs. Dans ce cas uniquement, cela veut dire que la page a bien été visitée et mémorisée, et que donc nous allons pouvoir aller plus loin dans nos invesitigations. Vérifions donc les compositions de mots, les liens vers les documents liés, ou encore l'intégration au sein des coquilles Flash comme nous l'explorerons au cours des prochains chapitres.
vlentchakourik-poustagourito et hourtyenkopal_gloutchbooga
Voici dans le titre de ce paragraphe, deux groupes de mots, l'un utilisant un tiret (vlentchakourik-poustagourito), l'autre un underscore (hourtyenkopal_gloutchbooga). Afin d'être plus précis, nous symboliserons le premier groupe par A-B et le second par C_D. Si, lors du test précédent sur clitchenkoustock la requête est fructueuse, elle devrait l'être également pour les deux groupes. Du moins en utilisant les groupes de manière complète. C'est à dire en tapant soit la paire A-B, soit la paire C_D dans un moteur de recherche. Vous pouvez utiliser les liens préformatés, ici sur Google et là sur Bing pour le premier groupe, et ici sur Google et là sur Bing pour le second groupe.
Cette première phase de recherche sur les paires globales validée, essayons de voir ce qu'il en ressort en testant chaque mot de manière indépendante. C'est à dire que si les moteurs de recherche reconnaissent bien le tiret et le underscore comme étant des séparateurs de mots, chaque mot devrait pouvoir être reconnu de manière independante par les moteurs de recherche. C'est à dire que les mots A, B, C et D devraient pouvoir être reconnus.
Toujours dans le but de rester dans des conditions de test optimales, les mots ne sont pas saisis de manière isolées, et ce que cela soit dans le texte de l'article ou dans de quelconques liens préconfigurés. Il vous faut donc les copier-coller ou les saisir directement dans le moteur de recherche.
Du texte, il y en a aussi dans les URLs optimisées
De la même manière, des tests peuvent être conduits sur l'utilisation de underscore ou de tiret comme caractères séparateurs dans les URLs optimisées. L'extension utilisée pour l'URL Rewriting du site de Puce et Média, sh404sef, propose de définir de manière générale un seul et unique caractère de remplacement souhaité. Il est possible d'utiliser le tiret, le underscore ou tout autre caractère de notre choix... Actuellement le caractère choisi est le '-'. Changer ce caractère, le changerait pour l'intégralité du site et ce n'est pas une opération souhaitée afin de ne pas perturber la gestion des liens et du référencement en cours. Par ailleurs, de manière automatique, le caractère "_" n'est pas reconnu par Joomla (plateforme utilisée par le site de Puce et Média), et si le titre d'un article l'utilise, il est omis de l'adresse lors de la génération de l'URL basée sur le titre de l'article.
Donc pour mener à bien cette expérience, le plus simple reste de faire appel à des pages externes et statiques. Nous allons placer des liens sortants vers ces pages en créant des URL enrichies en mots clés, une première utilisant le underscore et une seconde utilisant le tiret. Vous pourrez en déduire les mots clés en cliquant sur les liens et en consultant l'URL.







