Catégories
Rédaction Web SEO Technologie

Comment fonctionnent les moteurs de recherche ?

Chaque jour, vous posez des questions à Google ou Bing. Et chaque fois, un petit miracle se produit : vous obtenez une réponse plus ou moins pertinente. 

Il s’agit de la magie des algorithmes. Grâce à un ensemble de calculs pointus dont le secret est jalousement gardé, les grands moteurs de recherche trouvent, classent et fournissent les contenus qui répondront aux besoins des internautes. 

En effet, entre la publication et la restitution des résultats aux internautes, les moteurs de recherche suivent un fonctionnement en 3 étapes : le crawl (ou exploration), l’indexation et le rang (ou le positionnement des résultats les plus pertinents). Découvrez-les dans cet article.

L’étape 1 – Le crawl

Vous avez créé un site et publié du contenu. Celui-ci est ensuite découvert par un robot d’exploration, le GoogleBot, qui sillonne le web pour dénicher les nouveautés (articles, pages, vidéos, visuels, etc.).  C’est l’étape du crawl (ou exploration). 

Ne vous étonnez pas si l’article que vous avez publié hier n’a pas encore été repéré, un délai de quelques jours n’est pas surprenant. Le robot doit quotidiennement explorer des milliards de pages. Dans un souci d’économie, il concentre ses efforts sur les sites à forte autorité et régulièrement mis à jour ce qui implique que si votre site est récent, il ne sera pas sur la liste prioritaire du bot.  

Il existe toutefois des méthodes qui permettent d’accélérer le processus d’exploration. 

La plus simple est de renseigner le sitemap XML de votre site dans la Search Console. Il s’agit d’un répertoire de toutes les pages de votre site internet que le robot pourra facilement parcourir, en passant de lien en lien. 

Pour obtenir ce sitemap, il vous suffit de télécharger une extension telle que Yoast SEO (si vous êtes sur WordPress).

Lorsque vous avez créé le plan du site, il suffit d’en ajouter l’URL sur la Search Console.

Pour en savoir plus sur l’utilisation de la Search Console, je vous recommande les instructions publiées par Google pour les débutants. Cet article se concentre sur Google parce qu’il s’agit du moteur de recherche le plus utilisé, mais Bing, Yandex ou Baidu offrent les mêmes fonctionnalités.

Une autre méthode pour accélérer l’exploration de vos pages est d’obtenir des backlinks, c’est-à-dire des liens vers votre site, sur des sites à fort trafic. Ces derniers sont régulièrement crawlés, et le robot suit les liens qu’il y trouve. Ainsi, s’il découvre un lien vers votre site, il le suivra ce qui mènera à son exploration, au moins partielle. Idéalement, ce lien doit être naturel, c’est-à-dire que le propriétaire du site qui crée le lien doit l’avoir ajouté parce qu’il trouvait votre contenu intéressant. Mais comment faire lorsque vous venez de lancer votre site et que personne ne vous connaît ? 

C’est une question qui a tenu en éveil de nombreux éditeurs de site. Ils ont développé différentes solutions au fil du temps, et en particulier : 

  • Les articles sponsorisés : vous payez le propriétaire d’un site pour y publier un article contenant un lien vers votre site. 
  • Les articles invités : vous publiez gratuitement un article sur un autre site avec un lien vers le vôtre. Il s’agit d’un échange de bons procédés : le site hôte peut publier un article intéressant pour son audience et vous obtenez un backlink. 
  • Les liens affiliés : une personne fait la promotion de vos produits ou services en faisant un lien vers votre page de vente. Lorsqu’un achat est effectué à partir de ce lien, cette personne perçoit une commission. 

Comme toujours sur le Web, Google a constaté des abus : la création de liens de faible qualité, les échanges monétisés ou non qui se font passer pour des liens naturels, etc. Pour ne pas faire l’objet de sanctions, l’éditeur du site hôte doit impérativement préciser qu’il s’agit d’un lien sponsorisé en utilisant l’attribut « sponsored », même pour les articles invités non rémunérés. 

Enfin, une troisième astuce pour améliorer la rapidité d’exploration de vos pages est le maillage interne, c’est-à-dire la création de liens entre les pages de votre site. Dès que l’un de vos contenus sera exploré, le robot suivra le ou les liens internes vers vos autres publications. Vous devez aussi rendre l’ensemble de vos pages facilement accessible, idéalement en un ou deux clics depuis votre page d’accueil, ce qui favorisera leur exploration et leur indexation. C’est pourquoi vous devez créer des liens entre vos articles et idéalement ajouter un plan de site dans votre menu, par exemple avec l’extension WP Sitemap Page. 

L’étape 2 – L’indexation

Le robot explore toutes les nouvelles pages qu’il trouve. Mais cela ne suffit pas, il doit aussi les classer afin d’afficher les contenus les plus pertinents lorsqu’un internaute effectue une recherche. Il les indexe donc dans un répertoire où il ira puiser pour répondre aux recherches.

Pour réaliser ce tri, il se base notamment sur le texte pour en identifier la thématique précise. C’est ici que les mots clés, et désormais l’ensemble du champ lexical, interviennent. Les algorithmes ont longtemps basé leur analyse sur les seuls mots clés, ce qui a mené à des abus. Leur compréhension a été progressivement affinée, et le poids des requêtes clés a diminué pour laisser la place à d’autres aspects sémantiques importants : l’utilisation de synonymes et d’un champ lexical varié correspondant à la thématique du texte. 

Lors du travail de classement, l’algorithme détermine aussi si un texte apparaîtra dans l’index principal ou dans l’index secondaire. Dans le premier cas, les articles apparaissent directement lorsque l’internaute fait une recherche alors que dans le second cas, les articles n’apparaissent que si l’internaute relance la recherche en incluant les résultats omis. 

Les contenus qui se retrouvent dans l’index secondaire ne sont pas, en soi, pénalisés. Mais ils sont considérés inintéressants par Google, généralement parce qu’ils n’apportent pas de nouvelles informations aux internautes. Si vos textes sont coincés dans l’index secondaire, vous devez impérativement les retravailler pour apporter davantage de valeur aux lecteurs.

L’étape 3 – Le rang ou ranking

Position 0 ? Position 1, 2 ou 3 ? Obtenir un bon positionnement dans les résultats de recherche est le Graal de tous les éditeurs de site. 

De nombreux facteurs entrent en jeu pour parvenir à ce résultat. Au cours de la dernière phase, le robot prend en compte des critères sémantiques, mais pas seulement.

L’objectif du robot est de fournir la meilleure réponse possible à l’internaute. Elle doit donc être complète, précise, unique, de qualité et issue d’une source fiable. 

Sa pertinence est inévitablement déterminée par rapport au champ lexical et aux mots clés utilisés lors de la rédaction.  Les mots clés ont toutefois moins de poids, parce que pour répondre aux requêtes les moins précises et les plus conversationnelles, les algorithmes ont été entraînés à la compréhension du langage naturel. Cela signifie qu’ils n’analysent plus les mots tapés par les internautes ou présents sur vos pages web comme des éléments distincts. Ils les analysent en relation avec les autres mots afin d’identifier l’intention exacte de la recherche ou du texte.

Par exemple, lorsqu’un internaute cherche « groupe ayant chanté Waterloo » sur Google, il trouve des résultats relatifs à ABBA. S’il cherche « plat du sud avec de la courgette », il découvre des recettes de tian provençal. 

Le contenu n’est pas le seul facteur déterminant pour le positionnement de votre texte. Des critères techniques, tels que la vitesse de chargement du site ou sa sécurité (https), interviennent. Des éléments moins influençables à court terme peuvent aussi jouer : l’autorité de votre site fera la différence pour son positionnement sur des requêtes concurrentielles, pour lesquelles de nombreux textes se disputent les premières pages. Dans ce cas, il y a de fortes chances qu’un site ancien, ayant un grand nombre de rétroliens (backlinks), un haut trafic, etc. se positionne mieux qu’un site récent. 

Comprendre le fonctionnement des moteurs de recherche et en tirer profit

Vous savez maintenant que l’apparition d’un résultat sur Google ne relève pas de la magie, mais d’un processus en trois étapes, chacune ayant ses spécificités. 

Si vous n’avez pas encore connecté votre site à la Search Console, n’attendez plus. Vous pourrez vérifier l’indexation de vos pages, repérer d’éventuels problèmes, suivre l’évolution du trafic, etc. Ensuite, vous pourrez effectuer les modifications nécessaires : enrichissement du contenu, suppression des doublons, insertion d’images plus légères, etc. 

Pour en savoir plus : Fonctionnement de la recherche Google