« MUR » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' MUR ''' == Anglais == '''MUR ''' MUR, a training-free approach that makes test-time scaling for language model reasoning both more efficient and more effective. By using momentum-based uncertainty tracking to identify critical reasoning steps, the method achieves substantial computational savings while improving accuracy. == Source == [https://huggingface.co/papers/2507.14958 Source : h... ») |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
Solution sans entraînement qui alloue dynamiquement des ressources informatiques afin d'améliorer l'efficacité et la précision du raisonnement dans les '''[[Grand modèle de langues|grands modèles de langues]]''' et qui est compatible avec diverses méthodes de '''''test-time scaling'''''. | |||
== Compléments == | |||
L'acronyme MUR provient du terme anglais ''Momentum Uncertainty-guided Reasoning '' | |||
== Français == | == Français == | ||
Ligne 10 : | Ligne 13 : | ||
'''MUR ''' | '''MUR ''' | ||
''Training-free solution that dynamically allocates computational resources to improve reasoning efficiency and accuracy in LLMs, which is compatible with various test-time sclaing methods.'' | |||
== | == Sources == | ||
[https://arxiv.org/abs/2507.14958 Source : arxiv] | |||
[https://huggingface.co/papers/2507.14958 Source : huggingface] | [https://huggingface.co/papers/2507.14958 Source : huggingface] |
Version du 8 octobre 2025 à 11:10
en construction
Définition
Solution sans entraînement qui alloue dynamiquement des ressources informatiques afin d'améliorer l'efficacité et la précision du raisonnement dans les grands modèles de langues et qui est compatible avec diverses méthodes de test-time scaling.
Compléments
L'acronyme MUR provient du terme anglais Momentum Uncertainty-guided Reasoning
Français
MUR
Anglais
MUR
Training-free solution that dynamically allocates computational resources to improve reasoning efficiency and accuracy in LLMs, which is compatible with various test-time sclaing methods.
Sources
Contributeurs: Arianne Arel, wiki
