« Sondage d'un grand modèle de langue » : différence entre les versions


m (Patrickdrouin a déplacé la page Llm probing vers Sondage d'un grand modèle de langue)
Aucun résumé des modifications
Ligne 5 : Ligne 5 :
L'objectif est de comprendre comment ces modèles encodent les connaissances linguistiques, sémantiques et factuelles.  
L'objectif est de comprendre comment ces modèles encodent les connaissances linguistiques, sémantiques et factuelles.  


Cette méthode consiste à entraîner de petits [[Adaptation par modèle auxiliaire|modèles auxiliaires]] ou [[Classificateur|classificateurs]] légers nommés ''sondes'' sur les vecteurs d'activation du modèle afin de prédire des caractéristiques spécifiques (par exemple, la syntaxe ou la logique).
Cette méthode consiste à entraîner de petits [[Adaptation par modèle auxiliaire|modèles auxiliaires]] ou [[Classificateur|classificateurs]] légers nommés ''sondes'' sur les [[activation|vecteurs d'activation]] du modèle afin de prédire des caractéristiques spécifiques (par exemple, la syntaxe ou la logique).


==Français==
==Français==

Version du 31 mars 2026 à 14:50

Définition

Technique utilisée en interprétabilité de l'IA pour analyser les états cachés (latents) des grands modèles de langues (GML).

Compléments

L'objectif est de comprendre comment ces modèles encodent les connaissances linguistiques, sémantiques et factuelles.

Cette méthode consiste à entraîner de petits modèles auxiliaires ou classificateurs légers nommés sondes sur les vecteurs d'activation du modèle afin de prédire des caractéristiques spécifiques (par exemple, la syntaxe ou la logique).

Français

sondage d'un grand modèle de langue

sonder un grand modèle de langue

Anglais

LLM probing

Sources

Ballier et al. (2024) - sonder

Lin et al. (2025) - LLM probing

Contributeurs: Patrick Drouin