Lexique

Le jargon de l'IA, expliqué simplement

Un glossaire alphabétique des termes que l'on croise partout : IA générative, agents, AGI, LLM, RAG, fine-tuning, hallucination, transformer…

A

Agent (IA agentique)
Système d'IA capable de planifier et d'enchaîner des actions de manière autonome pour atteindre un objectif (naviguer sur le web, écrire du code, utiliser des outils).
AGI (Intelligence artificielle générale)
IA hypothétique capable d'égaler ou de dépasser l'humain sur la plupart des tâches cognitives.
Algorithme
Suite finie d'instructions permettant de résoudre un problème ou d'effectuer un calcul.
Apprentissage automatique (machine learning)
Famille d'algorithmes qui apprennent des régularités à partir de données plutôt que d'être programmés explicitement.
Apprentissage profond (deep learning)
Sous-domaine du machine learning fondé sur des réseaux de neurones à plusieurs couches.
Apprentissage par renforcement
Un agent apprend en recevant des récompenses ou des pénalités pour ses actions dans un environnement.
ASI (Super-intelligence artificielle)
Hypothèse d'une IA dépassant largement les capacités cognitives humaines dans tous les domaines.
Attention
Mécanisme central des transformers qui pondère l'importance relative des mots d'une séquence.

B

Benchmark
Test standardisé permettant de comparer les performances de différents modèles (MMLU, HumanEval, etc.).
Biais algorithmique
Distorsion systématique d'un modèle, souvent issue des données d'entraînement, pouvant produire des résultats injustes.

C / D

Chatbot
Programme conversationnel capable de dialoguer en langage naturel.
Cloud / Edge
Cloud : exécution sur des serveurs distants. Edge : exécution locale, sur l'appareil de l'utilisateur.
Corpus / Dataset
Ensemble de données utilisées pour entraîner ou évaluer un modèle.
Diffusion (modèles de)
Famille de modèles génératifs d'images (Stable Diffusion, Midjourney) qui partent d'un bruit et le débruitent progressivement.

E / F

Embeddings
Représentation numérique (vecteur) d'un mot, d'une image ou d'un document, qui permet aux machines de comparer leur sens.
Fine-tuning
Spécialisation d'un modèle pré-entraîné sur un domaine ou un style particulier.
Fondation (modèle de)
Grand modèle généraliste pré-entraîné sur de vastes données, adaptable à de nombreuses tâches.

G / H

Générative (IA)
IA produisant des contenus nouveaux (texte, image, son, vidéo, code) plutôt que de simplement classer ou prédire.
GPT (Generative Pre-trained Transformer)
Famille de modèles de langage d'OpenAI fondés sur l'architecture transformer.
GPU / TPU
Processeurs graphiques (NVIDIA) ou tensoriels (Google) optimisés pour l'entraînement et l'inférence des modèles.
Hallucination
Invention par un modèle de faits faux mais formulés avec assurance.

I / L

Inférence
Phase d'utilisation d'un modèle déjà entraîné pour produire une réponse.
LLM (Large Language Model)
Grand modèle de langage entraîné sur d'énormes corpus textuels (GPT, Claude, Gemini, Mistral, Llama).
LoRA (Low-Rank Adaptation)
Technique légère de fine-tuning qui ajoute de petits modules au modèle sans le réentraîner entièrement.

M / N

Multimodal
Modèle capable de traiter plusieurs types d'entrées : texte, image, audio, vidéo.
MoE (Mixture of Experts)
Architecture où seuls quelques sous-réseaux "experts" sont activés par requête, pour gagner en efficacité.
NLP (Traitement du langage naturel)
Branche de l'IA dédiée à la compréhension et à la production du langage humain.
Neurone artificiel
Unité de calcul élémentaire d'un réseau de neurones, inspirée du neurone biologique.

O / P

Open source / Open weights
Modèles dont le code et/ou les poids sont publiquement disponibles (Mistral, Llama, DeepSeek).
Overfitting (surapprentissage)
Un modèle qui mémorise ses données d'entraînement au point d'échouer sur des cas nouveaux.
Prompt
Instruction donnée à un modèle en langage naturel.
Prompt engineering
Art de formuler des prompts efficaces pour obtenir de meilleures réponses.
Paramètres (poids)
Valeurs numériques internes d'un modèle, ajustées pendant l'entraînement (mesurées en milliards : 7B, 70B, 405B…).

Q / R

Quantization
Compression d'un modèle en réduisant la précision de ses poids (8-bit, 4-bit) pour qu'il tienne sur du matériel modeste.
RAG (Retrieval-Augmented Generation)
Technique qui combine un modèle de langage avec une base documentaire pour répondre à partir de sources réelles.
Raisonnement (reasoning models)
Modèles entraînés à "réfléchir étape par étape" (o-series d'OpenAI, DeepSeek R1, Claude thinking, Gemini thinking).
Réseau de neurones
Modèle composé de couches de neurones artificiels interconnectés.
RLHF (Reinforcement Learning from Human Feedback)
Méthode d'alignement où des humains classent les réponses du modèle pour le rendre plus utile et inoffensif.

S / T

Singularité technologique
Hypothèse d'une accélération hors de contrôle des progrès de l'IA, dépassant l'intelligence humaine.
Supervisé / non supervisé
Supervisé : on apprend à partir d'exemples étiquetés. Non supervisé : on découvre des structures dans des données sans étiquettes.
Token
Unité élémentaire de texte (mot ou fragment) traitée par un LLM.
Transformer
Architecture neuronale introduite en 2017 ("Attention is All You Need"), fondement de tous les grands LLM modernes.
Test de Turing
Proposé en 1950 : une machine "pense" si un humain ne parvient pas à la distinguer d'un autre humain par conversation.

U / V / Z

Vision par ordinateur
Domaine de l'IA dédié à l'analyse d'images et de vidéos.
Zero-shot / Few-shot
Capacité d'un modèle à résoudre une tâche sans exemples (zero) ou avec quelques exemples (few) fournis dans le prompt.

Sources : documentation OpenAI / Anthropic / Google DeepMind / Mistral, Wikipédia, magazine Le Point « Le nouveau guide de la super intelligence artificielle ».