Glossaire de l'IA : plus de 50 termes expliqués simplement

Le vocabulaire de l’intelligence artificielle, expliqué simplement. Plus de 50 termes essentiels — LLM, RAG, fine-tuning, agent, hallucination, token… — pour comprendre l’actualité de l’IA sans jargon.

Tapez un mot pour filtrer la liste.

Agent IA

Système d’IA capable d’agir de façon autonome pour atteindre un objectif : il planifie, utilise des outils et enchaîne des actions sans intervention humaine à chaque étape. Voir notre annuaire d’agents.

AGI (Intelligence artificielle générale)

IA hypothétique capable d’égaler l’humain sur la quasi-totalité des tâches intellectuelles. Elle n’existe pas encore ; les modèles actuels restent spécialisés (« IA étroite »).

AI Act

Règlement européen sur l’intelligence artificielle, premier cadre légal complet au monde. Il classe les usages de l’IA par niveau de risque et impose des obligations correspondantes.

Alignement (alignment)

Discipline visant à faire en sorte qu’un système d’IA agisse conformément aux intentions et valeurs humaines, sans effets indésirables.

API

Interface de programmation permettant à un logiciel d’utiliser un modèle d’IA à distance. Les coûts d’API se mesurent au million de tokens — comparez-les sur quelllm.fr.

Apprentissage automatique (machine learning)

Branche de l’IA où un programme apprend des régularités à partir de données plutôt que de suivre des règles écrites à la main.

Apprentissage profond (deep learning)

Sous-domaine du machine learning fondé sur des réseaux de neurones à nombreuses couches. C’est la technologie derrière les LLM et la génération d’images.

Base de données vectorielle

Base de données qui stocke des embeddings (vecteurs) pour retrouver des contenus par similarité de sens. Brique clé du RAG.

Benchmark

Test standardisé servant à mesurer et comparer les performances des modèles (raisonnement, code, maths…). À interpréter avec prudence.

Biais algorithmique

Tendance d’un modèle à reproduire ou amplifier des préjugés présents dans ses données d’entraînement (genre, origine, etc.).

Chaîne de pensée (chain-of-thought)

Technique où le modèle déroule son raisonnement étape par étape avant de répondre, ce qui améliore la fiabilité sur les problèmes complexes.

Chatbot

Agent conversationnel qui dialogue en langage naturel. ChatGPT, Claude ou Gemini sont des chatbots grand public — voir notre comparateur.

Copilote (Copilot)

Assistant IA intégré à un logiciel pour épauler l’utilisateur (code, bureautique, design) sans le remplacer.

Deepfake

Contenu (image, audio, vidéo) synthétique réaliste généré par IA, imitant une personne réelle. Source de risques de désinformation.

Distillation

Technique consistant à entraîner un petit modèle à imiter un grand, pour obtenir des performances proches à moindre coût.

Données synthétiques

Données générées artificiellement (souvent par une IA) pour entraîner ou tester un modèle, notamment quand les données réelles manquent.

Embedding (vecteur sémantique)

Représentation numérique d’un texte ou d’une image sous forme de vecteur, capturant son sens. Permet la recherche par similarité.

Fenêtre de contexte

Quantité maximale de texte qu’un modèle peut traiter d’un seul coup (mesurée en tokens). Plus elle est grande, plus on peut lui soumettre de longs documents.

Few-shot / Zero-shot

Manières de guider un modèle : « zero-shot » = sans exemple, « few-shot » = avec quelques exemples dans le prompt pour montrer le format attendu.

Fine-tuning (réglage fin)

Ré-entraînement d’un modèle pré-existant sur des données spécifiques pour le spécialiser sur une tâche ou un ton.

Frontier model (modèle de pointe)

Les modèles les plus puissants du moment, à la frontière des capacités connues (ex. les derniers GPT, Claude, Gemini).

GPT

« Generative Pre-trained Transformer » : famille de modèles de langage d’OpenAI. Par extension, désigne souvent l’architecture des LLM génératifs.

GPU / TPU

Processeurs spécialisés dans le calcul parallèle, indispensables pour entraîner et exécuter les modèles d’IA. Les TPU sont les puces IA de Google.

Garde-fous (guardrails)

Règles et filtres encadrant les réponses d’une IA pour éviter les contenus dangereux, illégaux ou hors-sujet.

Hallucination

Quand une IA produit une information fausse mais formulée avec assurance. C’est la principale limite des LLM : vérifiez toujours les faits importants.

Inférence

Phase d’utilisation d’un modèle déjà entraîné pour produire une réponse (par opposition à l’entraînement). C’est ce qui consomme à chaque requête.

Jailbreak

Technique visant à contourner les garde-fous d’un modèle pour lui faire produire un contenu normalement interdit.

Knowledge cutoff (date de coupure)

Date limite des connaissances d’un modèle : il ignore les événements survenus après sa dernière phase d’entraînement, sauf s’il accède au web.

Latence

Temps de réponse d’un modèle. Une faible latence est cruciale pour les usages temps réel (voix, agents, code).

LLM (grand modèle de langage)

« Large Language Model » : modèle entraîné sur d’immenses corpus de texte pour comprendre et générer du langage. Cœur de ChatGPT, Claude, Gemini, etc.

LoRA

Méthode de fine-tuning légère qui n’ajuste qu’une petite partie des paramètres, réduisant fortement le coût de personnalisation d’un modèle.

MCP (Model Context Protocol)

Standard ouvert qui permet de connecter les assistants IA à des outils et sources de données externes de façon uniforme.

Modèle de fondation (foundation model)

Grand modèle généraliste pré-entraîné, servant de base que l’on adapte ensuite à de multiples usages (texte, image, code).

Multimodal

Se dit d’un modèle capable de traiter plusieurs types de données — texte, image, audio, vidéo — au sein d’une même conversation.

NLP (traitement du langage naturel)

Domaine de l’IA dédié à la compréhension et à la génération du langage humain.

Open weights (poids ouverts)

Modèle dont les paramètres sont publiquement téléchargeables : on peut l’exécuter et l’adapter soi-même (Llama, Mistral, DeepSeek). Idéal pour la souveraineté.

Paramètres

Les valeurs internes ajustées pendant l’entraînement (en milliards). Un nombre élevé n’est pas toujours synonyme de meilleure qualité.

Prompt

L’instruction ou la question que vous adressez à une IA. La qualité de la réponse dépend largement de la qualité du prompt.

Prompt engineering

Art de formuler des prompts efficaces : contexte, exemples, format de sortie attendu, contraintes claires.

Quantification (quantization)

Compression d’un modèle en réduisant la précision de ses nombres, pour le faire tourner sur du matériel plus modeste, au prix d’une légère perte de qualité.

RAG (génération augmentée par récupération)

Technique où l’IA va d’abord chercher des informations dans une base documentaire, puis rédige sa réponse en s’appuyant dessus. Réduit les hallucinations.

Raisonnement (reasoning model)

Modèles qui « réfléchissent » plus longtemps avant de répondre, en décomposant le problème. Meilleurs en maths, logique et code complexe.

Red teaming

Tests adverses menés pour débusquer les failles et comportements dangereux d’un modèle avant sa mise à disposition.

RLHF

« Apprentissage par renforcement à partir de retours humains » : méthode où des humains notent les réponses pour aligner le modèle sur les préférences attendues.

SLM (petit modèle de langage)

« Small Language Model » : modèle compact, rapide et peu coûteux, exécutable localement (téléphone, ordinateur), pour des tâches ciblées.

Souveraineté numérique

Capacité à maîtriser ses données et son infrastructure IA, sans dépendre d’acteurs étrangers. Argument clé des modèles européens et open weights.

Température

Réglage qui contrôle le degré d’aléatoire des réponses : basse = factuelle et stable, haute = créative et variée.

Token (jeton)

Unité de base que manipule un LLM : un fragment de mot. Le coût et la longueur de contexte se mesurent en tokens (≈ 0,75 mot en français).

Transformer

Architecture de réseau de neurones (2017) à la base de presque tous les LLM modernes, grâce à son mécanisme d’« attention ».

Vision par ordinateur

Domaine de l’IA permettant aux machines d’analyser et d’interpréter des images et des vidéos.

Watermarking (filigrane)

Marquage invisible inséré dans un contenu généré par IA pour permettre de l’identifier ultérieurement comme synthétique.

Aucun terme ne correspond à votre recherche.

Pour aller plus loin :
Comparer les assistants IA →
Annuaire des outils IA →

Mes lectures

Newsletter IA

Glossaire de l’IA : plus de 50 termes expliqués simplement

Guides & Thèmes

Mes lectures

Newsletter IA

L'actu IA chaque semaine

Guides & Thèmes