Le vocabulaire de l’intelligence artificielle, expliqué simplement. Plus de 50 termes essentiels — LLM, RAG, fine-tuning, agent, hallucination, token… — pour comprendre l’actualité de l’IA sans jargon.
Tapez un mot pour filtrer la liste.
Agent IA
Système d’IA capable d’agir de façon autonome pour atteindre un objectif : il planifie, utilise des outils et enchaîne des actions sans intervention humaine à chaque étape. Voir notre annuaire d’agents.
AGI (Intelligence artificielle générale)
IA hypothétique capable d’égaler l’humain sur la quasi-totalité des tâches intellectuelles. Elle n’existe pas encore ; les modèles actuels restent spécialisés (« IA étroite »).
AI Act
Règlement européen sur l’intelligence artificielle, premier cadre légal complet au monde. Il classe les usages de l’IA par niveau de risque et impose des obligations correspondantes.
Alignement (alignment)
Discipline visant à faire en sorte qu’un système d’IA agisse conformément aux intentions et valeurs humaines, sans effets indésirables.
API
Interface de programmation permettant à un logiciel d’utiliser un modèle d’IA à distance. Les coûts d’API se mesurent au million de tokens — comparez-les sur quelllm.fr.
Apprentissage automatique (machine learning)
Branche de l’IA où un programme apprend des régularités à partir de données plutôt que de suivre des règles écrites à la main.
Apprentissage profond (deep learning)
Sous-domaine du machine learning fondé sur des réseaux de neurones à nombreuses couches. C’est la technologie derrière les LLM et la génération d’images.
Base de données vectorielle
Base de données qui stocke des embeddings (vecteurs) pour retrouver des contenus par similarité de sens. Brique clé du RAG.
Benchmark
Test standardisé servant à mesurer et comparer les performances des modèles (raisonnement, code, maths…). À interpréter avec prudence.
Biais algorithmique
Tendance d’un modèle à reproduire ou amplifier des préjugés présents dans ses données d’entraînement (genre, origine, etc.).
Chaîne de pensée (chain-of-thought)
Technique où le modèle déroule son raisonnement étape par étape avant de répondre, ce qui améliore la fiabilité sur les problèmes complexes.
Chatbot
Agent conversationnel qui dialogue en langage naturel. ChatGPT, Claude ou Gemini sont des chatbots grand public — voir notre comparateur.
Copilote (Copilot)
Assistant IA intégré à un logiciel pour épauler l’utilisateur (code, bureautique, design) sans le remplacer.
Deepfake
Contenu (image, audio, vidéo) synthétique réaliste généré par IA, imitant une personne réelle. Source de risques de désinformation.
Distillation
Technique consistant à entraîner un petit modèle à imiter un grand, pour obtenir des performances proches à moindre coût.
Données synthétiques
Données générées artificiellement (souvent par une IA) pour entraîner ou tester un modèle, notamment quand les données réelles manquent.
Embedding (vecteur sémantique)
Représentation numérique d’un texte ou d’une image sous forme de vecteur, capturant son sens. Permet la recherche par similarité.
Fenêtre de contexte
Quantité maximale de texte qu’un modèle peut traiter d’un seul coup (mesurée en tokens). Plus elle est grande, plus on peut lui soumettre de longs documents.
Few-shot / Zero-shot
Manières de guider un modèle : « zero-shot » = sans exemple, « few-shot » = avec quelques exemples dans le prompt pour montrer le format attendu.
Fine-tuning (réglage fin)
Ré-entraînement d’un modèle pré-existant sur des données spécifiques pour le spécialiser sur une tâche ou un ton.
Frontier model (modèle de pointe)
Les modèles les plus puissants du moment, à la frontière des capacités connues (ex. les derniers GPT, Claude, Gemini).
GPT
« Generative Pre-trained Transformer » : famille de modèles de langage d’OpenAI. Par extension, désigne souvent l’architecture des LLM génératifs.
GPU / TPU
Processeurs spécialisés dans le calcul parallèle, indispensables pour entraîner et exécuter les modèles d’IA. Les TPU sont les puces IA de Google.
Garde-fous (guardrails)
Règles et filtres encadrant les réponses d’une IA pour éviter les contenus dangereux, illégaux ou hors-sujet.
Hallucination
Quand une IA produit une information fausse mais formulée avec assurance. C’est la principale limite des LLM : vérifiez toujours les faits importants.
Inférence
Phase d’utilisation d’un modèle déjà entraîné pour produire une réponse (par opposition à l’entraînement). C’est ce qui consomme à chaque requête.
Jailbreak
Technique visant à contourner les garde-fous d’un modèle pour lui faire produire un contenu normalement interdit.
Knowledge cutoff (date de coupure)
Date limite des connaissances d’un modèle : il ignore les événements survenus après sa dernière phase d’entraînement, sauf s’il accède au web.
Latence
Temps de réponse d’un modèle. Une faible latence est cruciale pour les usages temps réel (voix, agents, code).
LLM (grand modèle de langage)
« Large Language Model » : modèle entraîné sur d’immenses corpus de texte pour comprendre et générer du langage. Cœur de ChatGPT, Claude, Gemini, etc.
LoRA
Méthode de fine-tuning légère qui n’ajuste qu’une petite partie des paramètres, réduisant fortement le coût de personnalisation d’un modèle.
MCP (Model Context Protocol)
Standard ouvert qui permet de connecter les assistants IA à des outils et sources de données externes de façon uniforme.
Modèle de fondation (foundation model)
Grand modèle généraliste pré-entraîné, servant de base que l’on adapte ensuite à de multiples usages (texte, image, code).
Multimodal
Se dit d’un modèle capable de traiter plusieurs types de données — texte, image, audio, vidéo — au sein d’une même conversation.
NLP (traitement du langage naturel)
Domaine de l’IA dédié à la compréhension et à la génération du langage humain.
Open weights (poids ouverts)
Modèle dont les paramètres sont publiquement téléchargeables : on peut l’exécuter et l’adapter soi-même (Llama, Mistral, DeepSeek). Idéal pour la souveraineté.
Paramètres
Les valeurs internes ajustées pendant l’entraînement (en milliards). Un nombre élevé n’est pas toujours synonyme de meilleure qualité.
Prompt
L’instruction ou la question que vous adressez à une IA. La qualité de la réponse dépend largement de la qualité du prompt.
Prompt engineering
Art de formuler des prompts efficaces : contexte, exemples, format de sortie attendu, contraintes claires.
Quantification (quantization)
Compression d’un modèle en réduisant la précision de ses nombres, pour le faire tourner sur du matériel plus modeste, au prix d’une légère perte de qualité.
RAG (génération augmentée par récupération)
Technique où l’IA va d’abord chercher des informations dans une base documentaire, puis rédige sa réponse en s’appuyant dessus. Réduit les hallucinations.
Raisonnement (reasoning model)
Modèles qui « réfléchissent » plus longtemps avant de répondre, en décomposant le problème. Meilleurs en maths, logique et code complexe.
Red teaming
Tests adverses menés pour débusquer les failles et comportements dangereux d’un modèle avant sa mise à disposition.
RLHF
« Apprentissage par renforcement à partir de retours humains » : méthode où des humains notent les réponses pour aligner le modèle sur les préférences attendues.
SLM (petit modèle de langage)
« Small Language Model » : modèle compact, rapide et peu coûteux, exécutable localement (téléphone, ordinateur), pour des tâches ciblées.
Souveraineté numérique
Capacité à maîtriser ses données et son infrastructure IA, sans dépendre d’acteurs étrangers. Argument clé des modèles européens et open weights.
Température
Réglage qui contrôle le degré d’aléatoire des réponses : basse = factuelle et stable, haute = créative et variée.
Token (jeton)
Unité de base que manipule un LLM : un fragment de mot. Le coût et la longueur de contexte se mesurent en tokens (≈ 0,75 mot en français).
Transformer
Architecture de réseau de neurones (2017) à la base de presque tous les LLM modernes, grâce à son mécanisme d’« attention ».
Vision par ordinateur
Domaine de l’IA permettant aux machines d’analyser et d’interpréter des images et des vidéos.
Watermarking (filigrane)
Marquage invisible inséré dans un contenu généré par IA pour permettre de l’identifier ultérieurement comme synthétique.