« Qwen » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Qwen (prononcé « chüen ») est une famille de grands modèles de langage développés par Alibaba Cloud et basés sur l'architecture '''[[Llama]]''' de Meta AI. Plus précisément, il se compose de trois principaux types de modèles : le modèle linguistique de base (Qwen), les modèles optimisés pour les conversations (Qwen-Chat) et les variantes quantifiées des modèles de conversation. | Qwen (prononcé « chüen ») est une famille de grands modèles de langage développés par Alibaba Cloud et basés sur l'architecture '''[[Llama]]''' de Meta AI. Plus précisément, il se compose de trois principaux types de modèles : le modèle linguistique de base (Qwen), les modèles optimisés pour les conversations (Qwen-Chat) et les variantes quantifiées des modèles de conversation. | ||
Ligne 25 : | Ligne 23 : | ||
[[Catégorie: | [[Catégorie:GRAND_LEXIQUE_FRANÇAIS]] | ||
[[Catégorie:ENGLISH]] |
Dernière version du 5 août 2025 à 10:13
Définition
Qwen (prononcé « chüen ») est une famille de grands modèles de langage développés par Alibaba Cloud et basés sur l'architecture Llama de Meta AI. Plus précisément, il se compose de trois principaux types de modèles : le modèle linguistique de base (Qwen), les modèles optimisés pour les conversations (Qwen-Chat) et les variantes quantifiées des modèles de conversation.
Voir aussi grand modèle de langues, modèle fondateur et réseau autoattentif
Compléments
Qwen utilise un segmenteur personnalisé basé sur la bibliothèque tiktoken avec un vocabulaire de 151 851 segment textuel. Ce segmenteur est optimisé pour un encodage efficace des données chinoises, anglaises et codées, tout en prenant en charge le contenu multilingue. La famille de modèles Qwen 3 comprend à la fois des modèles denses ou non.
Aussi appelé Tongyi Qianwen.
Français
Qwen
Anglais
Qwen
Sources
Contributeurs: Arianne Arel, wiki
