« Grand modèle de langues multimodal » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(Une version intermédiaire par un autre utilisateur non affichée)
Ligne 2 : Ligne 2 :
[[Grand modèle de langues]] qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.  
[[Grand modèle de langues]] qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.  


Voir [[modèle multimodal]].
Voir aussi [[modèle multimodal]]


== Français ==
== Français ==
''' grand modèle de langue multimodal '''
''' grand modèle de langues multimodal '''


'''grand modèle de langage multimodal'''
'''grand modèle de langage multimodal'''

Dernière version du 5 janvier 2025 à 12:31

Définition

Grand modèle de langues qui admet plusieurs modalités de représentation de l'information des données (texte, son, image, vidéo, données issues de capteurs, etc.) en entrée et en sortie.

Voir aussi modèle multimodal

Français

grand modèle de langues multimodal

grand modèle de langage multimodal

GMLM

grand modèle multimodal

Anglais

multimodal large language model

MLLM

large multimodal model


Sources

Source : bdtechtalks

Source : Huang et al. (2023)

Source: Developpez.com