« MiniMax-M1 » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 5 : | Ligne 5 : | ||
Voir aussi '''[[mécanisme d'attention]]''' | Voir aussi '''[[mécanisme d'attention]]''' | ||
== Compléments == | |||
Attention: MiniMax-M1 n'est pas en lien avec l''''[[algorithme minimax]]'''. | |||
== Français == | == Français == |
Version du 14 juillet 2025 à 07:10
en construction
Définition
Il s'agit d'un modèle de raisonnement hybride à grande échelle et à open-weight, alimenté par une architecture hybride de mixture d'experts combinée à un mécanisme d'attention éclair. Il est entraîné à l'aide de l'apprentissage par renforcement à grande échelle sur divers problèmes. MiniMax-M1 est particulièrement adapté aux tâches complexes qui nécessitent le traitement de données volumineuses et une réflexion approfondie.
Voir aussi mécanisme d'attention
Compléments
Attention: MiniMax-M1 n'est pas en lien avec l'algorithme minimax.
Français
MiniMax-M1
Anglais
MiniMax-M1
Sources
Contributeurs: Arianne Arel, wiki
