Grand modèle de langues (GML)

Définition

Un grand modèle de langues ou GML (en anglais, Large Language Model, LLM) est un modèle de langue qui a été préentraîné sur un très vaste corpus multilingue à usage général et multilingue comme Wikipédia ou le contenu de la Toile en entier.

Basé sur un réseau de neurones autoattentif, un grand modèle de langues (GML) comporte un très grand nombre de paramètres.

Typiquement un GML est un modèle génératif capable de prédire le prochain mot d'une séquence à partir d'une requête et de son contexte.

Voir aussi modèle fondateur

Compléments

On dit « grand modèle de langues » et non « grand modèle de langage », parce que le langage désigne la faculté d'utiliser une langue alors que la langue est l'objet modélisé. Aussi, tous ces grands modèles sont multilingues. Pour être précis, on ajoute parfois l'adjectif génératif.

Un grand modèle de langues sert de base pour l'élaboration des robots conversationnels génératifs (RCG) capables de générer des textes entiers.

Typiquement un grand modèle de langues comporte plus de 10 milliards de paramètres, souvent plusieurs centaines de milliards.

Des chercheurs de l'Université Stanford ont proposé le terme modèle fondateur ou modèle de fondation (« foundation model ») pour définir un ensemble de grands modèles de langue basés sur des architectures autoattentives pré-entraînées.

Français

grand modèle de langues

grand modèle de langue

grand modèle de langage

GML

grand modèle linguistique

modèle fondateur

modèle de fondation

Anglais

large language model

LLM

generative large language model

foundation model

Español

modelo extenso de lenguaje

Los modelos extensos de lenguaje (LLM, siglas in inglés para Large Language Model ) son modelos del lenguaje estadísticos, preentrenados en un corpus multilingüe muy amplio. Basados en transformadores, los grandes modelos lingüísticos incluyen un número muy elevado de parámetros.

Normalmente, un LLM es capaz de predecir la siguiente palabra de una secuencia basándose en una consulta y su contexto. Véase también: modelo fundacional

Sources

Source: CNRS

Source: Légifrance

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »