« Apprentissage par curriculum auto-évolutif » : différence entre les versions


m (Patrickdrouin a déplacé la page Self-Evolving Curriculum vers Apprentissage par curriculum auto-évolutif : apprentissage par curriculum auto-évolutif )
Aucun résumé des modifications
 
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==
== Définition ==
Méthode d''''[[apprentissage par curriculum]]''' automatique adaptée au '''[[peaufinage]]''' de l''''[[apprentissage par renforcement]]''' des '''[[Grand modèle de langues|grands modèles de langues]]'''. Elle ajuste dynamiquement le curriculum d'entraînement en fonction des capacités actuelles du '''[[modèle]]''' à l'aide de techniques telles que la sélection du '''[[Problème du bandit manchot|bandit manchot]]''' et l''''[[analyse de sensibilité]]'''.  
Méthode d''''[[apprentissage par curriculum]]''' automatique adaptée au '''[[peaufinage]]''' de l''''[[apprentissage par renforcement]]''' des '''[[Grand modèle de langues|grands modèles de langues]]'''. Elle ajuste dynamiquement le curriculum d'entraînement en fonction des capacités actuelles du '''[[modèle]]''' à l'aide de techniques telles que la sélection du '''[[Problème du bandit manchot|bandit manchot]]''' et l''''[[analyse de sensibilité]]'''.  
Ligne 14 : Ligne 12 :
''' SEC'''
''' SEC'''


''Automatic curriculum learning method tailored for reinforcement learning fine-tuning of large language models. It dynamically adjusts the training curriculum according to the model’s current capabilities using techniques like multi-armed bandit selection and sensitivity analysis. Its defining property is its dependence on performance-driven adaptation.''
<!-- ''Automatic curriculum learning method tailored for reinforcement learning fine-tuning of large language models. It dynamically adjusts the training curriculum according to the model’s current capabilities using techniques like multi-armed bandit selection and sensitivity analysis. Its defining property is its dependence on performance-driven adaptation.'' ->


== Sources ==
== Sources ==
Ligne 21 : Ligne 19 :
[https://www.emergentmind.com/topics/self-evolving-curriculum-sec  Source : Emergent Mind]
[https://www.emergentmind.com/topics/self-evolving-curriculum-sec  Source : Emergent Mind]


[[Catégorie:vocabulary]]
[[Catégorie:Publication]]

Dernière version du 24 février 2026 à 14:45

Définition

Méthode d'apprentissage par curriculum automatique adaptée au peaufinage de l'apprentissage par renforcement des grands modèles de langues. Elle ajuste dynamiquement le curriculum d'entraînement en fonction des capacités actuelles du modèle à l'aide de techniques telles que la sélection du bandit manchot et l'analyse de sensibilité.

Voir aussi apprentissage automatique, entraînement et optimisation de la politique relative au groupe

Français

apprentissage par curriculum auto-évolutif

Anglais

Self-Evolving Curriculum Learning

SEC


Contributeurs: Arianne Arel, Patrick Drouin