« Grand modèle de langues multimodal » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(12 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
[[Grand modèle de langue]] qui admet plusieurs modes de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.  
[[Grand modèle de langues]] qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.  


== Compléments ==
Voir aussi [[modèle multimodal]]
La frontière entre multimodal et multimédia est floue. On parle de multimédia quand il est question de médias bien établis (image, vidéo, son, texte) alors qu'on parle de multimodal pour tout ce qui peut éventuellement se représenter sous forme binaire.
 
En IA, la tendance est plutôt d'utiliser l'adjectif ''multimodal'' que ''multimedia''. On utilise 'grand modèle de langue multimodal' quand le modèle de langue est la partie prépondérante du système d'IA. Le cas échéant, on parle plutôt de ''grand modèle multimodal''.


== Français ==
== Français ==
''' grand modèle de langue multimodal '''
''' grand modèle de langues multimodal '''
 
''' grand modèle de langue multimédia '''


'''grand modèle de langage multimodal'''
'''grand modèle de langage multimodal'''
Ligne 17 : Ligne 12 :


'''grand modèle multimodal'''
'''grand modèle multimodal'''
== Anglais ==
== Anglais ==
''' multimodal large language model'''
''' multimodal large language model'''
Ligne 26 : Ligne 19 :
'''large multimodal model'''
'''large multimodal model'''


<!--  Basically, multimodal LLMs combine text with other kinds of information, such as images, videos, audio, and other sensory data. Multimodality can solve some of the problems of the current generation of LLMs. Multimodal language models will also unlock new applications that were impossible with text-only models. -->
Basically, multimodal LLMs combine text with other kinds of information, such as images, videos, audio, and other sensory data. Multimodality can solve some of the problems of the current generation of LLMs. Multimodal language models will also unlock new applications that were impossible with text-only models.  
 
==Español==
 
''''' modelo extenso de lenguaje multimodal '''''


''Investigadores de la Universidad de Stanford han propuesto el término modelo fundacional (del inglès foundation model) para definir un conjunto de modelo extenso de lenguaje basados en arquitecturas de transformadores preentrenadas en grandes corpus, a veces utilizando varias modalidades (texto, voz, imágenes, etc.).''
<small>
 
''Modelos fundacionales como BERT, GPT-3, LLaMA y DALL-E pueden adaptarse a una amplia gama de tareas.''
 
==Sources==


[https://bdtechtalks.com/2023/03/13/multimodal-large-language-models/  Source : bdtechtalks]
[https://bdtechtalks.com/2023/03/13/multimodal-large-language-models/  Source : bdtechtalks]
Ligne 36 : Ligne 36 :


[https://microsoft.developpez.com/actu/342095/Microsoft-presente-le-grand-modele-de-langage-multimodal-Kosmos-1-les-chercheurs-montrent-que-le-passage-des-LLM-aux-MLLM-offre-de-nouvelles-capacites  Source: Developpez.com]
[https://microsoft.developpez.com/actu/342095/Microsoft-presente-le-grand-modele-de-langage-multimodal-Kosmos-1-les-chercheurs-montrent-que-le-passage-des-LLM-aux-MLLM-offre-de-nouvelles-capacites  Source: Developpez.com]
 
{{Modèle:101}}
 
[[Catégorie:Intelligence artificielle]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 22 juillet 2025 à 11:31

Définition

Grand modèle de langues qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.

Voir aussi modèle multimodal

Français

grand modèle de langues multimodal

grand modèle de langage multimodal

GMLM

grand modèle multimodal

Anglais

multimodal large language model

MLLM

large multimodal model

Basically, multimodal LLMs combine text with other kinds of information, such as images, videos, audio, and other sensory data. Multimodality can solve some of the problems of the current generation of LLMs. Multimodal language models will also unlock new applications that were impossible with text-only models.

Español

modelo extenso de lenguaje multimodal

Investigadores de la Universidad de Stanford han propuesto el término modelo fundacional (del inglès foundation model) para definir un conjunto de modelo extenso de lenguaje basados en arquitecturas de transformadores preentrenadas en grandes corpus, a veces utilizando varias modalidades (texto, voz, imágenes, etc.).

Modelos fundacionales como BERT, GPT-3, LLaMA y DALL-E pueden adaptarse a una amplia gama de tareas.

Sources

Source : bdtechtalks

Source : Huang et al. (2023)

Source: Developpez.com 101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle » Ligne bleue2.jpg