Glossaire de l'Intelligence Artificielle (IA) : les termes essentiels

🧠

Concepts fondamentaux

Intelligence Artificielle (IA)

L’intelligence artificielle désigne la capacité d’un système informatique à effectuer des tâches qui requièrent normalement l’intelligence humaine. Bien qu’il n’existe pas de définition universellement acceptée, on peut la définir comme l’art de faire accomplir à une machine des fonctions cognitives typiques de l’esprit humain. L’IA englobe plusieurs approches : les systèmes génératifs (création de contenus), les systèmes de reconnaissance (identification de patterns), et les systèmes prédictifs (anticipation d’événements futurs).

Algorithme

Un algorithme est une séquence logique et ordonnée d’instructions permettant de résoudre un problème ou d’accomplir une tâche spécifique. En IA, les algorithmes sont les recettes qui dictent comment le système traite les données en entrée pour produire un résultat en sortie. Ils sont le cœur de tout système intelligent, définissant la manière dont la machine apprend et prend des décisions.

Apprentissage automatiqueMachine Learning

Le Machine Learning est une branche de l’IA où les algorithmes apprennent de manière autonome à partir de données, sans être explicitement programmés pour chaque tâche. Le système améliore ses performances en observant des exemples, en identifiant des patterns, et en ajustant progressivement ses paramètres internes. Cette capacité d’apprentissage par l’expérience permet aux machines de s’adapter et de généraliser à de nouvelles situations jamais rencontrées auparavant.

Apprentissage profondDeep Learning

Le Deep Learning est une méthode avancée de Machine Learning qui utilise des réseaux de neurones artificiels composés de multiples couches. Ces réseaux, inspirés du fonctionnement du cerveau humain, sont capables d’apprendre des représentations hiérarchiques de données complexes. Le terme « profond » fait référence au grand nombre de couches qui permettent d’extraire des caractéristiques de plus en plus abstraites et sophistiquées.

IA générative

L’IA générative désigne les systèmes capables de créer du contenu original : textes, images, vidéos, musique, ou code informatique. Ces systèmes, comme GPT, DALL-E ou Stable Diffusion, ont appris les structures et patterns de vastes corpus de données pour générer de nouveaux contenus cohérents et créatifs. Ils révolutionnent les domaines de la création, de la communication et de l’innovation.

Réseaux de neurones artificiels

Les réseaux de neurones artificiels sont des structures mathématiques inspirées du fonctionnement biologique des neurones humains. Composés de nœuds interconnectés organisés en couches, ils traitent l’information en la propageant de couche en couche, chaque connexion ayant un poids qui détermine l’importance de l’information transmise. Ces réseaux excellent dans la reconnaissance de patterns complexes et non linéaires.

📊

Entraînement et données

Corpus d’entraînementDataset

Le corpus d’entraînement est l’ensemble complet des données utilisées pour enseigner au modèle ses compétences. La qualité, la diversité et l’équilibre de ce corpus influencent directement les performances du modèle, ses capacités de généralisation, et ses biais potentiels. Un corpus biaisé ou déséquilibré produira inévitablement des résultats biaisés ou des réponses stéréotypées, d’où l’importance cruciale de sa curation.

Entraînement

L’entraînement est le processus par lequel un modèle d’IA apprend à partir des données. Il se déroule généralement en plusieurs phases :

Pré-entraînement : Apprentissage non supervisé sur de vastes corpus de données brutes
Entraînement supervisé : Apprentissage guidé avec des données étiquetées par des humains
RLHF : Apprentissage par renforcement basé sur les retours humains, où le modèle apprend à maximiser les récompenses

AjustementFine-tuning

Le fine-tuning est un entraînement complémentaire et ciblé effectué sur un modèle déjà pré-entraîné. Cette technique permet d’adapter un modèle généraliste à un domaine spécifique (médical, juridique, financier…) ou d’ajuster son style de réponse, tout en conservant ses connaissances générales. Cette approche est beaucoup plus économique en ressources qu’un entraînement complet depuis zéro.

Paramètres

Les paramètres sont les variables internes qu’un modèle ajuste durant son apprentissage. Chaque paramètre influence la façon dont le modèle comprend et traite l’information. Exprimés en milliards (B pour billions), leur nombre est un indicateur de la capacité du modèle : plus un modèle contient de paramètres, plus il peut théoriquement traiter des informations complexes et nuancées.

JetonToken

Un token est l’unité élémentaire de texte traitée par les modèles de langage. Il peut représenter un mot complet, une syllabe, un fragment de mot, ou même un signe de ponctuation. Le processus de découpage en tokens, appelé tokenisation, varie selon les modèles et les langues. La plupart des modèles facturent leur utilisation en nombre de tokens traités.

Augmentation de données

L’augmentation de données est une technique visant à enrichir artificiellement le corpus d’entraînement en créant des variations des données existantes. Pour les images, cela peut inclure des rotations, changements de luminosité ou recadrages. Cette méthode améliore la robustesse du modèle et sa capacité de généralisation en l’exposant à une plus grande diversité de situations.

💬

Utilisation et interaction

Inférence

L’inférence désigne la phase où le modèle déjà entraîné est utilisé pour produire des prédictions ou générer du contenu. Contrairement à l’entraînement qui modifie les paramètres du modèle, l’inférence mobilise les connaissances acquises pour répondre à de nouvelles requêtes. C’est la phase d’utilisation pratique du modèle par les utilisateurs finaux.

PromptRequête

Le prompt est l’instruction ou la question donnée à un modèle d’IA pour obtenir une réponse. L’art du prompt engineering consiste à formuler des requêtes précises et bien structurées pour obtenir les meilleurs résultats possibles. Un prompt efficace spécifie clairement l’objectif, le contexte, le format attendu, et toute contrainte pertinente.

Température

La température est un paramètre qui contrôle le niveau d’aléatoire et de créativité dans les réponses générées. Une température basse (0.0-0.3) produit des résultats plus prévisibles et cohérents, idéale pour des tâches nécessitant précision et logique. Une température élevée (0.7-1.0) génère des sorties plus créatives et variées, au risque d’une cohérence moindre.

Hallucination

Une hallucination est une réponse fausse, inventée ou sans fondement factuel, générée de manière convaincante par un modèle d’IA. Ce phénomène provient de la nature probabiliste des modèles de langage qui cherchent à maximiser la vraisemblance textuelle plutôt que la véracité factuelle. Les hallucinations sont l’une des limites majeures des systèmes d’IA actuels et nécessitent une vigilance constante de l’utilisateur.

Mode de raisonnement

Les modèles avec mode de raisonnement intègrent une étape de « réflexion » interne avant de fournir leur réponse finale. Cette phase de raisonnement intermédiaire leur permet de décomposer des problèmes complexes, d’évaluer différentes approches, et de produire des réponses de meilleure qualité, particulièrement dans les domaines mathématiques, logiques ou de programmation.

Multimodal

Un modèle multimodal est capable de traiter et de combiner plusieurs types de données : texte, images, audio, vidéo. Chaque modalité est traitée par un encodeur spécialisé qui convertit les données dans un format exploitable par le modèle central. Cette capacité permet des applications puissantes comme l’analyse d’images avec description textuelle, ou la génération de contenu cross-modal.

🔧

Types de modèles et architecture

Open Source

Un modèle open source met à disposition l’ensemble de ses composants : architecture, poids du modèle, code source, données d’entraînement et méthodologie. Cette transparence totale permet à la communauté de l’analyser, le modifier, l’améliorer, ou de le réentraîner selon ses besoins. C’est un pilier de la recherche collaborative et de l’innovation démocratisée en IA.

Semi-ouvert

Les modèles semi-ouverts proposent un compromis : les poids du modèle sont disponibles (souvent sous licence spécifique), permettant une utilisation locale ou des modifications, mais sans accès complet aux données d’entraînement ni aux méthodologies détaillées. Des exemples incluent Gemma, Llama, et Mistral, offrant flexibilité tout en préservant certains secrets industriels.

Propriétaire

Un modèle propriétaire est une « boîte noire » dont les poids, l’architecture exacte et les données d’entraînement ne sont pas accessibles publiquement. Les utilisateurs interagissent via des interfaces (API, applications web) sans connaître les détails techniques internes. Des exemples majeurs incluent GPT-4, Claude, et Gemini. Ces modèles offrent souvent les meilleures performances mais moins de contrôle.

Transformer

Le Transformer est une architecture révolutionnaire de réseau neuronal introduite en 2017, qui utilise un mécanisme d’attention pour traiter les séquences de données. Cette architecture a révolutionné le traitement du langage naturel et est à la base des modèles les plus performants actuels (GPT, BERT, T5). Sa capacité à gérer efficacement le contexte long en fait l’architecture dominante en IA moderne.

LLMLarge Language Model

Les LLM (Large Language Models) sont des modèles de langage de très grande taille, entraînés sur d’immenses corpus de textes. Avec des dizaines ou centaines de milliards de paramètres, ils démontrent des capacités émergentes impressionnantes : compréhension contextuelle profonde, génération de texte cohérent, raisonnement, et même certaines formes de créativité. GPT-4, Claude et PaLM sont des exemples emblématiques.

Vision par ordinateur

La vision par ordinateur est le domaine de l’IA qui permet aux machines de « voir » et d’interpréter le contenu visuel d’images et de vidéos. Elle englobe la détection d’objets, la segmentation d’images, la reconnaissance faciale, et l’analyse de scènes. Les réseaux de neurones convolutifs (CNN) sont particulièrement efficaces dans ce domaine, capable d’extraire automatiquement les caractéristiques visuelles pertinentes.

⚡

Infrastructure et performance

GPUGraphics Processing Unit

Les GPU sont des processeurs spécialisés conçus initialement pour le rendu graphique, mais devenus indispensables pour l’IA. Leur architecture parallèle permet d’effectuer simultanément des milliers d’opérations mathématiques, accélérant considérablement l’entraînement et l’inférence des modèles. Sans GPU, l’explosion actuelle de l’IA n’aurait pas été possible. Les GPU modernes sont des centaines de fois plus rapides que les CPU pour ces tâches.

TPUTensor Processing Unit

Les TPU sont des processeurs développés spécifiquement par Google pour les opérations de Machine Learning. Optimisés pour les calculs tensoriels (matrices multidimensionnelles), ils offrent des performances encore supérieures aux GPU pour l’entraînement et le déploiement de modèles d’IA à grande échelle, tout en consommant moins d’énergie.

Centre de donnéesData Center

Les centres de données sont des infrastructures physiques massives regroupant des milliers de serveurs équipés de GPU et TPU. Ils hébergent, entraînent et exécutent les modèles d’IA à grande échelle. Leur refroidissement, nécessaire pour éviter la surchauffe de ces équipements ultra-puissants, constitue une source majeure de consommation énergétique et un enjeu environnemental crucial de l’IA moderne.

Edge AI

L’Edge AI désigne le déploiement de modèles d’intelligence artificielle directement sur des appareils locaux (smartphones, caméras, capteurs) plutôt que dans le cloud. Cette approche réduit la latence, protège la confidentialité des données, et permet un fonctionnement hors ligne. Elle nécessite des modèles optimisés et compressés pour fonctionner avec les ressources limitées des appareils embarqués.

Optimisation de modèle

L’optimisation de modèle regroupe les techniques visant à réduire la taille, améliorer la vitesse et diminuer la consommation énergétique d’un modèle, tout en préservant ses performances. Les méthodes incluent la quantification (réduction de la précision numérique), l’élagage (suppression de connexions peu importantes), et la distillation (transfert de connaissances vers un modèle plus petit).

Latence

La latence représente le délai entre la soumission d’une requête et la réception de la réponse d’un système d’IA. Pour les applications en temps réel (assistants vocaux, véhicules autonomes), une latence minimale est cruciale. Elle dépend de nombreux facteurs : taille du modèle, puissance de calcul disponible, optimisation du code, et infrastructure réseau.

⚖️

Éthique et enjeux sociétaux

Biais algorithmique

Les biais algorithmiques sont des distorsions systématiques dans les décisions ou prédictions d’un modèle d’IA, souvent héritées de biais présents dans les données d’entraînement. Ces biais peuvent refléter et amplifier les préjugés sociaux existants (sexisme, racisme, classisme), créant des systèmes discriminatoires. La détection et l’atténuation des biais sont des enjeux éthiques majeurs de l’IA responsable.

ExplicabilitéXAI

L’explicabilité (ou XAI pour eXplainable AI) est la capacité d’un système d’IA à expliquer ses décisions de manière compréhensible pour les humains. Dans des domaines critiques (médecine, justice, finance), comprendre pourquoi une IA prend une décision est aussi important que la décision elle-même. C’est un enjeu crucial pour la confiance, la transparence et la conformité réglementaire.

IA responsable

L’IA responsable est une approche éthique du développement et du déploiement de systèmes d’IA, visant à garantir qu’ils soient équitables, transparents, sûrs et respectueux de la vie privée. Elle englobe la détection et correction des biais, la protection des données, l’explicabilité des décisions, et la prise en compte des impacts sociétaux. C’est une nécessité pour une adoption durable et bénéfique de l’IA.

Empreinte carbone

L’empreinte carbone de l’IA mesure les émissions de gaz à effet de serre liées à l’entraînement et l’utilisation des modèles. Un modèle de langage de grande taille peut nécessiter autant d’énergie que plusieurs foyers pendant des mois. La consommation énergétique des centres de données, leur refroidissement et la fabrication du matériel constituent des défis environnementaux majeurs que la communauté IA doit adresser de toute urgence.

Deepfake

Les deepfakes sont des contenus médias (images, vidéos, audio) synthétiques hyper-réalistes créés par des techniques d’IA, notamment les réseaux antagonistes génératifs (GAN). Bien qu’ayant des applications légitimes (effets spéciaux, doublage), ils posent des risques sérieux de désinformation, manipulation et atteinte à la vie privée. La détection et la régulation des deepfakes sont des enjeux sociétaux croissants.

Vie privée différentielle

La vie privée différentielle est une technique mathématique permettant d’entraîner des modèles d’IA sur des données sensibles tout en garantissant qu’aucune information individuelle ne peut être extraite du modèle. Elle ajoute du « bruit » contrôlé aux données pour protéger la confidentialité sans compromettre significativement l’utilité du modèle. C’est une approche clé pour concilier IA et protection de la vie privée.

Glossaire de l’Intelligence Artificielle

Comprendre l’Intelligence Artificielle