Catégories
Rédaction optimisée

Comment fonctionnent les moteurs de recherche ?

Chaque jour, vous posez des questions Ă  Google ou Bing. Et chaque fois, un petit miracle se produit : vous obtenez une rĂ©ponse plus ou moins pertinente. 

Il s’agit de la magie des algorithmes. Grâce Ă  un ensemble de calculs pointus dont le secret est jalousement gardĂ©, les grands moteurs de recherche trouvent, classent et fournissent les contenus qui rĂ©pondront aux besoins des internautes. 

En effet, entre la publication et la restitution des résultats aux internautes, les moteurs de recherche suivent un fonctionnement en 3 étapes : le crawl (ou exploration), l’indexation et le rang (ou le positionnement des résultats les plus pertinents). Découvrez-les dans cet article.

L’étape 1 – Le crawl

Vous avez crĂ©Ă© un site et publiĂ© du contenu. Celui-ci est ensuite dĂ©couvert par un robot d’exploration, le GoogleBot, qui sillonne le web pour dĂ©nicher les nouveautĂ©s (articles, pages, vidĂ©os, visuels, etc.).  C’est l’étape du crawl (ou exploration). 

Ne vous Ă©tonnez pas si l’article que vous avez publiĂ© hier n’a pas encore Ă©tĂ© repĂ©rĂ©, un dĂ©lai de quelques jours n’est pas surprenant. Le robot doit quotidiennement explorer des milliards de pages. Dans un souci d’économie, il concentre ses efforts sur les sites Ă  forte autoritĂ© et rĂ©gulièrement mis Ă  jour ce qui implique que si votre site est rĂ©cent, il ne sera pas sur la liste prioritaire du bot.  

Il existe toutefois des mĂ©thodes qui permettent d’accĂ©lĂ©rer le processus d’exploration. 

La plus simple est de renseigner le sitemap XML de votre site dans la Search Console. Il s’agit d’un rĂ©pertoire de toutes les pages de votre site internet que le robot pourra facilement parcourir, en passant de lien en lien. 

Pour obtenir ce sitemap, il vous suffit de télécharger une extension telle que Yoast SEO (si vous êtes sur WordPress).

Lorsque vous avez créé le plan du site, il suffit d’en ajouter l’URL sur la Search Console.

Pour en savoir plus sur l’utilisation de la Search Console, je vous recommande les instructions publiées par Google pour les débutants. Cet article se concentre sur Google parce qu’il s’agit du moteur de recherche le plus utilisé, mais Bing, Yandex ou Baidu offrent les mêmes fonctionnalités.

Une autre mĂ©thode pour accĂ©lĂ©rer l’exploration de vos pages est d’obtenir des backlinks, c’est-Ă -dire des liens vers votre site, sur des sites Ă  fort trafic. Ces derniers sont rĂ©gulièrement crawlĂ©s, et le robot suit les liens qu’il y trouve. Ainsi, s’il dĂ©couvre un lien vers votre site, il le suivra ce qui mènera Ă  son exploration, au moins partielle. IdĂ©alement, ce lien doit ĂŞtre naturel, c’est-Ă -dire que le propriĂ©taire du site qui crĂ©e le lien doit l’avoir ajoutĂ© parce qu’il trouvait votre contenu intĂ©ressant. Mais comment faire lorsque vous venez de lancer votre site et que personne ne vous connaĂ®t ? 

C’est une question qui a tenu en Ă©veil de nombreux Ă©diteurs de site. Ils ont dĂ©veloppĂ© diffĂ©rentes solutions au fil du temps, et en particulier : 

  • Les articles sponsorisĂ©s : vous payez le propriĂ©taire d’un site pour y publier un article contenant un lien vers votre site. 
  • Les articles invitĂ©s : vous publiez gratuitement un article sur un autre site avec un lien vers le vĂ´tre. Il s’agit d’un Ă©change de bons procĂ©dĂ©s : le site hĂ´te peut publier un article intĂ©ressant pour son audience et vous obtenez un backlink. 
  • Les liens affiliĂ©s : une personne fait la promotion de vos produits ou services en faisant un lien vers votre page de vente. Lorsqu’un achat est effectuĂ© Ă  partir de ce lien, cette personne perçoit une commission. 

Comme toujours sur le Web, Google a constatĂ© des abus : la crĂ©ation de liens de faible qualitĂ©, les Ă©changes monĂ©tisĂ©s ou non qui se font passer pour des liens naturels, etc. Pour ne pas faire l’objet de sanctions, l’éditeur du site hĂ´te doit impĂ©rativement prĂ©ciser qu’il s’agit d’un lien sponsorisĂ© en utilisant l’attribut « sponsored », mĂŞme pour les articles invitĂ©s non rĂ©munĂ©rĂ©s. 

Enfin, une troisième astuce pour amĂ©liorer la rapiditĂ© d’exploration de vos pages est le maillage interne, c’est-Ă -dire la crĂ©ation de liens entre les pages de votre site. Dès que l’un de vos contenus sera explorĂ©, le robot suivra le ou les liens internes vers vos autres publications. Vous devez aussi rendre l’ensemble de vos pages facilement accessible, idĂ©alement en un ou deux clics depuis votre page d’accueil, ce qui favorisera leur exploration et leur indexation. C’est pourquoi vous devez crĂ©er des liens entre vos articles et idĂ©alement ajouter un plan de site dans votre menu, par exemple avec l’extension WP Sitemap Page. 

L’étape 2 – L’indexation

Le robot explore toutes les nouvelles pages qu’il trouve. Mais cela ne suffit pas, il doit aussi les classer afin d’afficher les contenus les plus pertinents lorsqu’un internaute effectue une recherche. Il les indexe donc dans un répertoire où il ira puiser pour répondre aux recherches.

Pour rĂ©aliser ce tri, il se base notamment sur le texte pour en identifier la thĂ©matique prĂ©cise. C’est ici que les mots clĂ©s, et dĂ©sormais l’ensemble du champ lexical, interviennent. Les algorithmes ont longtemps basĂ© leur analyse sur les seuls mots clĂ©s, ce qui a menĂ© Ă  des abus. Leur comprĂ©hension a Ă©tĂ© progressivement affinĂ©e, et le poids des requĂŞtes clĂ©s a diminuĂ© pour laisser la place Ă  d’autres aspects sĂ©mantiques importants : l’utilisation de synonymes et d’un champ lexical variĂ© correspondant Ă  la thĂ©matique du texte. 

Lors du travail de classement, l’algorithme dĂ©termine aussi si un texte apparaĂ®tra dans l’index principal ou dans l’index secondaire. Dans le premier cas, les articles apparaissent directement lorsque l’internaute fait une recherche alors que dans le second cas, les articles n’apparaissent que si l’internaute relance la recherche en incluant les rĂ©sultats omis. 

Les contenus qui se retrouvent dans l’index secondaire ne sont pas, en soi, pénalisés. Mais ils sont considérés inintéressants par Google, généralement parce qu’ils n’apportent pas de nouvelles informations aux internautes. Si vos textes sont coincés dans l’index secondaire, vous devez impérativement les retravailler pour apporter davantage de valeur aux lecteurs.

L’étape 3 – Le rang ou ranking

Obtenir un bon positionnement dans les rĂ©sultats de recherche est le Graal de tous les Ă©diteurs de site. 

De nombreux facteurs entrent en jeu pour parvenir à ce résultat. Au cours de la dernière phase, le robot prend en compte des critères sémantiques, mais pas seulement.

L’objectif du robot est de fournir la meilleure rĂ©ponse possible Ă  l’internaute. Elle doit donc ĂŞtre complète, prĂ©cise, unique, de qualitĂ© et issue d’une source fiable. 

Sa pertinence est inĂ©vitablement dĂ©terminĂ©e par rapport au champ lexical et aux mots clĂ©s utilisĂ©s lors de la rĂ©daction.  Les mots clĂ©s ont toutefois moins de poids, parce que pour rĂ©pondre aux requĂŞtes les moins prĂ©cises et les plus conversationnelles, les algorithmes ont Ă©tĂ© entraĂ®nĂ©s Ă  la comprĂ©hension du langage naturel. Cela signifie qu’ils n’analysent plus les mots tapĂ©s par les internautes ou prĂ©sents sur vos pages web comme des Ă©lĂ©ments distincts. Ils les analysent en relation avec les autres mots afin d’identifier l’intention exacte de la recherche ou du texte.

Par exemple, lorsqu’un internaute cherche « groupe ayant chantĂ© Waterloo » sur Google, il trouve des rĂ©sultats relatifs Ă  ABBA. S’il cherche « plat du sud avec de la courgette », il dĂ©couvre des recettes de tian provençal. 

Le contenu n’est pas le seul facteur dĂ©terminant pour le positionnement de votre texte. Des critères techniques, tels que la vitesse de chargement du site ou sa sĂ©curitĂ© (https), interviennent. Des Ă©lĂ©ments moins influençables Ă  court terme peuvent aussi jouer : l’autoritĂ© de votre site fera la diffĂ©rence pour son positionnement sur des requĂŞtes concurrentielles, pour lesquelles de nombreux textes se disputent les premières pages. Dans ce cas, il y a de fortes chances qu’un site ancien, ayant un grand nombre de rĂ©troliens (backlinks), un haut trafic, etc. se positionne mieux qu’un site rĂ©cent. 

Comprendre le fonctionnement des moteurs de recherche et en tirer profit

Vous savez maintenant que l’apparition d’un rĂ©sultat sur Google ne relève pas de la magie, mais d’un processus en trois Ă©tapes, chacune ayant ses spĂ©cificitĂ©s. 

Si vous n’avez pas encore connectĂ© votre site Ă  la Search Console, n’attendez plus. Vous pourrez vĂ©rifier l’indexation de vos pages, repĂ©rer d’éventuels problèmes, suivre l’évolution du trafic, etc. Ensuite, vous pourrez effectuer les modifications nĂ©cessaires : enrichissement du contenu, suppression des doublons, insertion d’images plus lĂ©gères, etc. 

Pour en savoir plus : Fonctionnement de la recherche Google