MiniMax-M1


Révision datée du 5 août 2025 à 10:04 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Il s'agit d'un modèle de raisonnement hybride à grande échelle et à open-weight, alimenté par une architecture hybride de mixture d'experts combinée à un mécanisme d'attention éclair. Il est entraîné à l'aide de l'apprentissage par renforcement à grande échelle sur divers problèmes. MiniMax-M1 est particulièrement adapté aux tâches complexes qui nécessitent le traitement de données volumineuses et une réflexion approfondie.

Voir aussi mécanisme d'attention

Compléments

Attention: MiniMax-M1 n'est pas en lien avec l'algorithme minimax.

Français

MiniMax-M1

Anglais

MiniMax-M1

Sources

Source : arxiv

Source : huggingface

Source : MiniMax-M1

Contributeurs: Arianne Arel, wiki