Glossaire IA
Tous les termes de l'intelligence artificielle expliqués simplement. Zéro jargon, zéro prérequis.
28 termes
A
Agent IA
Un programme qui ne se contente pas de répondre : il agit. Il peut chercher des infos, exécuter des tâches et prendre des décisions en chaîne.
En pratique : Un agent peut lire vos emails, résumer les urgents et rédiger des réponses.
API
Une interface qui permet à deux logiciels de communiquer entre eux. C'est le pont entre votre application et un modèle d'IA.
En pratique : Quand une app utilise ChatGPT en coulisses, elle passe par l'API d'OpenAI.
Attention (mécanisme d')
La technique qui permet aux modèles de langage de comprendre quels mots d'une phrase sont liés entre eux, même s'ils sont éloignés. C'est le cœur des Transformers.
C
Chain-of-thought
Une technique de prompt qui demande au modèle de raisonner étape par étape avant de donner sa réponse finale. Améliore la précision sur les tâches complexes.
Contexte (fenêtre de)
La quantité de texte qu'un modèle peut "voir" en une seule conversation. Se mesure en tokens. Plus la fenêtre est grande, plus le modèle peut traiter de documents.
En pratique : Claude a une fenêtre de 200K tokens, soit environ 500 pages.
D
Diffusion (modèle de)
La technologie derrière la génération d'images IA. Le modèle apprend à "débruiter" une image, partant du bruit aléatoire pour arriver à une image nette.
En pratique : Stable Diffusion, DALL·E et Midjourney utilisent tous cette technique.
E
Embedding
Une représentation numérique d'un texte sous forme de vecteur. Permet de mesurer la similarité entre deux phrases et de faire de la recherche sémantique.
F
Few-shot prompting
Donner quelques exemples au modèle dans votre prompt pour lui montrer exactement le format et le style de réponse attendus.
En pratique : "Voici 3 exemples de résumés → maintenant fais le 4e dans le même style."
Fine-tuning
Ré-entraîner un modèle existant sur vos propres données pour le spécialiser sur une tâche précise. Plus technique et coûteux que le prompting.
G
GPT
Generative Pre-trained Transformer. La famille de modèles de langage créée par OpenAI (GPT-3, GPT-4, GPT-5). Le "T" vient de Transformer.
H
Hallucination
Quand un modèle génère une information fausse avec la même assurance qu'un fait vérifié. Le principal risque des LLM, c'est pourquoi il faut toujours vérifier.
En pratique : Un LLM peut inventer une citation, un lien web ou une statistique qui n'existent pas.
I
Inférence
Le moment où un modèle génère une réponse. C'est l'utilisation du modèle (par opposition à l'entraînement). Chaque message que vous envoyez à ChatGPT déclenche une inférence.
L
LLM (Large Language Model)
Un modèle d'IA entraîné sur des milliards de textes, capable de comprendre et générer du langage. Claude, GPT, Gemini, Mistral sont tous des LLM.
LoRA
Une technique d'adaptation légère qui permet de fine-tuner un modèle sans modifier tous ses paramètres. Plus rapide et moins cher que le fine-tuning classique.
M
MCP (Model Context Protocol)
Un protocole créé par Anthropic qui permet aux LLM de se connecter à des outils externes (bases de données, APIs, fichiers). La "prise USB" des modèles de langage.
Multimodal
Un modèle qui comprend et génère plusieurs types de contenu : texte, image, audio, vidéo.
En pratique : GPT-4o peut voir une photo, l'analyser et en parler.
N
NLP (Natural Language Processing)
Le domaine de l'IA qui s'occupe de comprendre et traiter le langage humain. Les LLM sont la dernière génération de NLP.
O
Open source
Un modèle dont le code et les poids sont publics et librement utilisables.
En pratique : Llama (Meta), Mistral et DeepSeek sont open source. GPT et Claude ne le sont pas.
Overfitting
Quand un modèle apprend "par cœur" ses données d'entraînement au lieu d'apprendre des patterns généralisables. Il performe bien sur les données connues mais mal sur les nouvelles.
P
Prompt
L'instruction que vous donnez à un modèle d'IA. La qualité de la réponse dépend directement de la qualité du prompt. C'est la compétence fondamentale.
Prompt engineering
L'art de formuler des instructions précises pour obtenir les meilleurs résultats d'un LLM. Inclut les techniques de rôle, contexte, exemples et contraintes.
R
RAG (Retrieval-Augmented Generation)
Une technique qui permet au modèle de chercher dans vos documents avant de répondre, au lieu de se fier uniquement à son entraînement. Réduit les hallucinations.
En pratique : Claude Projects et les Custom GPTs avec fichiers utilisent du RAG.
S
SFT (Supervised Fine-Tuning)
La phase d'entraînement où un modèle apprend à partir d'exemples de conversations de qualité, rédigés par des humains.
System prompt
L'instruction cachée qui définit le comportement du modèle avant même que l'utilisateur ne parle. C'est ce qui transforme un LLM générique en assistant spécialisé.
T
Temperature
Le paramètre qui contrôle la créativité du modèle. Basse (0-0.3) = réponses prévisibles et factuelles. Haute (0.7-1) = réponses plus créatives et variées.
Token
L'unité de texte que le modèle traite. Environ 1 token = 0,75 mot en français. Les prix et les limites de contexte se mesurent en tokens.
Transformer
L'architecture de réseau de neurones inventée par Google en 2017 qui est à la base de tous les LLM modernes. Son innovation clé : le mécanisme d'attention.
V
Vibe coding
Coder en décrivant ce qu'on veut en langage naturel, et laisser l'IA écrire le code. Permet de construire des apps sans savoir programmer.
En pratique : Avec Claude Code, vous décrivez votre app et l'IA la construit.