Le vocabulaire de l’intelligence artificielle

Vous entendez souvent parler d’intelligence artificielle, de modèles de langage, d’IA générative, de ChatGPT, de Gemini, de DALL-E, et bien d’autres. Mais savez-vous vraiment ce que tout cela signifie ? Voici un glossaire essentiel pour démystifier ces termes et concepts clés. Que vous soyez rédacteur, marketeur ou simplement curieux, ce récapitulatif du vocabulaire de l’intelligence artificielle vous aidera à mieux comprendre et apprivoiser cette nouvelle technologie.

AEO (Answer Engine Optimization)

L’AEO est une technique d’optimisation des contenus web consistant à les structurer pour répondre directement à une question. L’objectif est que cette réponse apparaisse dans les featured snippets de Google (et potentiellement dans les IA overviews) ce qui permet à l’utilisateur d’obtenir une réponse sans cliquer sur un lien. Cette approche complémentaire au SEO assure la visibilité de la marque sur le web. Concrètement, le rédacteur fournit une réponse claire et autonome dès les premières lignes de chaque section du texte, de sorte qu’elle puisse être extraite et comprise hors contexte.

AI Overview (ou aperçu IA)

Les aperçus IA sont des blocs générés par l’IA de Google, affichés en tête de page avant les résultats organiques. Ils synthétise une réponse à la requête de l’utilisateur en citant plusieurs sources. Être cité et référence dans les aperçus IA est le nouvel Eldorado du marketing de contenu en ligne.

Apprentissage automatique (Machine Learning)

L’apprentissage automatique est une branche de l’intelligence artificielle où les ordinateurs apprennent à partir de données pour améliorer leurs performances dans une tâche spécifique sans être explicitement programmés, en utilisant des algorithmes pour identifier des motifs et faire des prédictions.

Apprentissage non supervisé

L’apprentissage non supervisé est une sous-catégorie de l’apprentissage automatique où un modèle est entraîné à partir de données non étiquetées. Le modèle doit identifier des motifs et des structures dans les données sans guidance explicite.

Apprentissage par renforcement (Reinforcement learning from human feedback – RLHF)

L’apprentissage par renforcement est une technique d’entraînement des modèles d’intelligence artificielle où des humains évaluent les réponses du modèle, fournissant des retours qui guident l’IA pour améliorer ses performances et générer des résultats plus précis et pertinents. Les réviseurs humains pénalisent les contenus problématiques et récompensent les contenus de qualité.

Apprentissage supervisé

L’apprentissage supervisé est une sous-catégorie de l’apprentissage automatique où un modèle est entraîné à partir de données étiquetées. Chaque exemple de données d’entraînement est associé à une étiquette ou une réponse connue. Le modèle apprend à prédire cette étiquette à partir des caractéristiques des données. Une fois entraîné, le modèle peut faire des prédictions sur de nouvelles données non étiquetées en se basant sur les relations apprises. Les modèles tels que ChatGPT sont majoritairement fondés sur l’apprentissage supervisé et l’apprentissage par renforcement, bien qu’une partie d’apprentissage non supervisé intervienne également.

Émergence

L’émergence est un concept selon lequel une combinaison de plusieurs éléments peut engendrer un résultat qui dépasse la simple combinaison de ces éléments. Dans le domaine de l’IA, l’émergence est le fait que l’IA sache faire des choses pour lesquelles elle n’a pas été spécifiquement programmée, comme mimer l’émotion, l’empathie ou jouer aux échecs.

Hallucination

Dans le domaine de l’intelligence artificielle, une hallucination est une réponse qui semble plausible, mais est factuellement incorrecte ou non basée sur des données réelles. Plus largement, le terme est aussi utilisé pour désigner les réponses lunaires données par les IA. Plusieurs facteurs peuvent expliquer les hallucinations. Florilège :

L’IA n’est pas programmée pour répondre « je ne sais pas ». Elle fournit une réponse dans tous les cas, même lorsqu’elle manque de données pour offrir une réponse correcte ou complète.
Les LLM sont programmés avec une composante aléatoire pour varier les réponses données à l’utilisateur.
Les données ayant servi à entraîner l’IA peuvent contenir des erreurs, des biais ou de l’humour indiscernable par les modèles de langage.
Les utilisateurs font un usage non raisonné de l’IA, essayant de la tromper en lui posant des questions piège qui mènent à des réponses bizarres ou fausses.

Le danger réside dans les hallucinations subtiles, plus difficiles à repérer.

GEO (Generative Engine Optimization)

Le GEO désigne l’ensemble des techniques qui optimisent un contenu pour être cité par les moteurs de recherche génératifs comme ChatGPT, Perplexity ou les AI Overviews de Google. Contrairement au SEO classique qui vise un classement dans une liste de liens, le GEO vise une citation dans une réponse synthétisée par l’IA.

Intelligence artificielle (ou IA)

L’IA est un domaine de l’informatique qui crée des machines capables de réaliser des tâches qui nécessitent normalement l’intelligence humaine. Cela inclut des tâches comme la reconnaissance de la parole, la compréhension du langage naturel, la reconnaissance des images et la prise de décisions. L’IA est un terme général qui englobe toutes les technologies et méthodes visant à rendre les machines « intelligentes ». Elle s’applique aux voitures, aux machines industrielles, etc.

Intelligence artificielle générale (Artificial General Intelligence – AGI)

Il s’agit d’une forme d’IA hypothétique qui possède un niveau de compétence, de compréhension, d’analyse, de créativité et de flexibilité similaire à celui d’un humain. Elle aurait aussi la capacité d’évoluer de façon autonome, en enrichissant ses connaissances.

À l’heure actuelle, elle n’existe pas, même si un papier de recherche a relevé des éclairs d’intelligence artificielle générale chez GPT4. Il est toutefois difficile de savoir si ces « éclairs” » sont survenus de façon autonome ou à la suite d’un entraînement de la machine à la réalisation de tâches spécifiques. Il est aussi important de noter qu’une majorité des personnes ayant contribué à ce papier étaient, directement ou indirectement, liées à Microsoft.

IA Générative

L’intelligence artificielle générative est une technologie qui crée du contenu nouveau, comme du texte, des images, de la musique ou des vidéos, en utilisant des modèles entraînés sur de vastes ensembles de données. Elle utilise des modèles statistiques pour comprendre les structures et les motifs dans les données d’entraînement. Elle les utilise ensuite pour produire de nouveaux résultats. ChatGPT et DALL-E, par exemple, sont des IA génératives.

LLM (Large Language Model)

Les modèles de langage sont des sous-catégories d’intelligences artificielles spécialement conçues pour comprendre et générer du texte en langage naturel. Par exemple, ChatGPT est une IA et plus spécifiquement, un LLM. Ces modèles sont entraînés sur de vastes ensembles de données textuelles et utilisent des techniques avancées de traitement du langage naturel pour effectuer des tâches comme la traduction, la rédaction ou la réponse à des questions.

Prompt

Un prompt est une instruction ou une question donnée à un modèle de langage pour générer une réponse. C’est le texte initial qui guide le modèle sur le sujet ou la tâche à accomplir.

Promptologie ou prompt engineering

Le prompt engineering est la technique de conception et de formulation de requêtes ou instructions spécifiques pour optimiser les réponses des modèles de langage (LLM). En ajustant les mots, la structure et le contexte des prompts, l’utilisateur guide le modèle pour obtenir des résultats plus précis, pertinents et utiles.

SEO (Search Everywhere Optimization)

Dans son acception récente, le SEO dépasse largement les moteurs de recherche tels que Google ou Bing. Il désigne une stratégie de visibilité multicanale : être trouvable sur les moteurs de recherche traditionnels, mais aussi sur TikTok, Reddit, YouTube ou les IA génératives. Le défi est que chaque plateforme a ses propres critères de mise en avant. Un contenu optimisé « search everywhere » est conçu pour répondre à une intention de recherche, quel que soit l’endroit où elle s’exprime.

Superintelligence artificielle (artificial superintelligence – ASI)

La superintelligence artificielle est une forme d’IA hypothétique qui surpasse l’intelligence humaine dans tous les domaines, qu’ils soient créatifs, mathématiques ou scientifiques. Elle ne se limite pas à réaliser des tâches spécifiques. Elle dépasse les esprits (humains) les plus brillants dans tous les domaines. Elle n’existe pas. Un tel phénomène est improbable (mais pas impossible).

Technologie à usage général (General Purpose Technology – GPT)

Ce sont les technologies qui touchent tous les secteurs de l’économie et de la société. Elles affectent votre façon de travailler, de vivre, de vous déplacer, d’interagir, etc. Par exemple, l’électricité et l’Internet sont des technologies à usage général, car elles ont changé la manière dont nous vivons et travaillons dans de nombreux domaines différents. L’intelligence artificielle, et plus précisément les LLM, est une technologie à usage général. Maintenant, vous voyez d’où vient le nom GPT.

Traitement du langage naturel (NLP)

Le traitement du langage naturel est une branche de l’intelligence artificielle qui permet aux machines de comprendre, interpréter et générer du texte ou de la parole en langage humain, facilitant ainsi l’interaction entre les humains et les ordinateurs.

Zero-click search ou recherche zéro clic

Une recherche zéro clic est une recherche qui se conclut sans visiter aucun site. L’utilisateur obtient sa réponse directement dans l’interface qu’il utilise — sur la page de résultats Google ou dans un LLM conversationnel.

Le vocabulaire de l’intelligence artificielle est riche et varié. De nombreuses notions ne sont pas abordées dans cet article. Si vous voulez en savoir plus, n’hésitez pas à consulter les sources suivantes :