Lexique de l'IA

A

Agent (IA agentique): Système d'IA capable de planifier et d'enchaîner des actions de manière autonome pour atteindre un objectif (naviguer sur le web, écrire du code, utiliser des outils).
AGI (Intelligence artificielle générale): IA hypothétique capable d'égaler ou de dépasser l'humain sur la plupart des tâches cognitives.
Algorithme: Suite finie d'instructions permettant de résoudre un problème ou d'effectuer un calcul.
Apprentissage automatique (machine learning): Famille d'algorithmes qui apprennent des régularités à partir de données plutôt que d'être programmés explicitement.
Apprentissage profond (deep learning): Sous-domaine du machine learning fondé sur des réseaux de neurones à plusieurs couches.
Apprentissage par renforcement: Un agent apprend en recevant des récompenses ou des pénalités pour ses actions dans un environnement.
ASI (Super-intelligence artificielle): Hypothèse d'une IA dépassant largement les capacités cognitives humaines dans tous les domaines.
Attention: Mécanisme central des transformers qui pondère l'importance relative des mots d'une séquence.

B

Benchmark: Test standardisé permettant de comparer les performances de différents modèles (MMLU, HumanEval, etc.).
Biais algorithmique: Distorsion systématique d'un modèle, souvent issue des données d'entraînement, pouvant produire des résultats injustes.

C / D

Chatbot: Programme conversationnel capable de dialoguer en langage naturel.
Cloud / Edge: Cloud : exécution sur des serveurs distants. Edge : exécution locale, sur l'appareil de l'utilisateur.
Corpus / Dataset: Ensemble de données utilisées pour entraîner ou évaluer un modèle.
Diffusion (modèles de): Famille de modèles génératifs d'images (Stable Diffusion, Midjourney) qui partent d'un bruit et le débruitent progressivement.

E / F

Embeddings: Représentation numérique (vecteur) d'un mot, d'une image ou d'un document, qui permet aux machines de comparer leur sens.
Fine-tuning: Spécialisation d'un modèle pré-entraîné sur un domaine ou un style particulier.
Fondation (modèle de): Grand modèle généraliste pré-entraîné sur de vastes données, adaptable à de nombreuses tâches.

G / H

Générative (IA): IA produisant des contenus nouveaux (texte, image, son, vidéo, code) plutôt que de simplement classer ou prédire.
GPT (Generative Pre-trained Transformer): Famille de modèles de langage d'OpenAI fondés sur l'architecture transformer.
GPU / TPU: Processeurs graphiques (NVIDIA) ou tensoriels (Google) optimisés pour l'entraînement et l'inférence des modèles.
Hallucination: Invention par un modèle de faits faux mais formulés avec assurance.

I / L

Inférence: Phase d'utilisation d'un modèle déjà entraîné pour produire une réponse.
LLM (Large Language Model): Grand modèle de langage entraîné sur d'énormes corpus textuels (GPT, Claude, Gemini, Mistral, Llama).
LoRA (Low-Rank Adaptation): Technique légère de fine-tuning qui ajoute de petits modules au modèle sans le réentraîner entièrement.

M / N

Multimodal: Modèle capable de traiter plusieurs types d'entrées : texte, image, audio, vidéo.
MoE (Mixture of Experts): Architecture où seuls quelques sous-réseaux "experts" sont activés par requête, pour gagner en efficacité.
NLP (Traitement du langage naturel): Branche de l'IA dédiée à la compréhension et à la production du langage humain.
Neurone artificiel: Unité de calcul élémentaire d'un réseau de neurones, inspirée du neurone biologique.

O / P

Open source / Open weights: Modèles dont le code et/ou les poids sont publiquement disponibles (Mistral, Llama, DeepSeek).
Overfitting (surapprentissage): Un modèle qui mémorise ses données d'entraînement au point d'échouer sur des cas nouveaux.
Prompt: Instruction donnée à un modèle en langage naturel.
Prompt engineering: Art de formuler des prompts efficaces pour obtenir de meilleures réponses.
Paramètres (poids): Valeurs numériques internes d'un modèle, ajustées pendant l'entraînement (mesurées en milliards : 7B, 70B, 405B…).

Q / R

Quantization: Compression d'un modèle en réduisant la précision de ses poids (8-bit, 4-bit) pour qu'il tienne sur du matériel modeste.
RAG (Retrieval-Augmented Generation): Technique qui combine un modèle de langage avec une base documentaire pour répondre à partir de sources réelles.
Raisonnement (reasoning models): Modèles entraînés à "réfléchir étape par étape" (o-series d'OpenAI, DeepSeek R1, Claude thinking, Gemini thinking).
Réseau de neurones: Modèle composé de couches de neurones artificiels interconnectés.
RLHF (Reinforcement Learning from Human Feedback): Méthode d'alignement où des humains classent les réponses du modèle pour le rendre plus utile et inoffensif.

S / T

Singularité technologique: Hypothèse d'une accélération hors de contrôle des progrès de l'IA, dépassant l'intelligence humaine.
Supervisé / non supervisé: Supervisé : on apprend à partir d'exemples étiquetés. Non supervisé : on découvre des structures dans des données sans étiquettes.
Token: Unité élémentaire de texte (mot ou fragment) traitée par un LLM.
Transformer: Architecture neuronale introduite en 2017 ("Attention is All You Need"), fondement de tous les grands LLM modernes.
Test de Turing: Proposé en 1950 : une machine "pense" si un humain ne parvient pas à la distinguer d'un autre humain par conversation.

U / V / Z

Vision par ordinateur: Domaine de l'IA dédié à l'analyse d'images et de vidéos.
Zero-shot / Few-shot: Capacité d'un modèle à résoudre une tâche sans exemples (zero) ou avec quelques exemples (few) fournis dans le prompt.

Sources : documentation OpenAI / Anthropic / Google DeepMind / Mistral, Wikipédia, magazine Le Point « Le nouveau guide de la super intelligence artificielle ».

Le jargon de l'IA, expliqué simplement

A

B