« Apprentissage par renforcement à base de modèles » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 24 : | Ligne 24 : | ||
'''MBRL''' | '''MBRL''' | ||
==Español== | |||
''''' aprendizaje por refuerzo basado en modelos ''''' | |||
''El aprendizaje por refuerzo basado en modelos se aplica en el contexto de un agente que interactúa con su entorno, que aprende un modelo del entorno y luego utiliza este modelo para tomar decisiones.'' | |||
==Sources== | ==Sources== | ||
Ligne 36 : | Ligne 43 : | ||
[https://huggingface.co/learn/deep-rl-course/en/unitbonus3/model-based '' Model Based Reinforcement Learning (MBRL)'' - Hugginface] | [https://huggingface.co/learn/deep-rl-course/en/unitbonus3/model-based '' Model Based Reinforcement Learning (MBRL)'' - Hugginface] | ||
{{Modèle:101}} | |||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:101]] | [[Catégorie:101]] |
Dernière version du 21 juillet 2025 à 15:07
Définition
L'apprentissage par renforcement à base de modèles s'applique dans le cadre d'un agent interagissant avec son environnement qui apprend un modèle dudit environnement, puis qui exploite ce modèle pour sa prise de décisions.
Compléments
Un agent tente, par essais et erreurs, de résoudre un problème en accumulant des données sur ses actions et sur l'état de l’environnement qui en résulte. Avec ces données, l'agent crée un modèle dynamique, pour raisonner sur son environnement. À partir de ce modèle qui évolue dans le temps, l'agent peut ainsi prendre des décisions en prédisant leurs effets. Ce processus itératif fait que le modèle s'améliore graduellement, tout comme les décisions prises par l'agent.
L'apprentissage par renforcement basé sur un modèle ne diffère de son homologue sans modèle que par l'apprentissage d'un modèle de dynamique, mais cela a des effets substantiels en aval sur la manière dont les décisions sont prises.
Voir : apprentissage par renforcement sans modèle, apprentissage par renforcement, modèle.
Français
apprentissage par renforcement à base de modèles
apprentissage par renforcement basé sur un modèle
apprentissage par renforcement avec modèles
Anglais
model based reinforcement learning
model based RL
MBRL
Español
aprendizaje por refuerzo basado en modelos
El aprendizaje por refuerzo basado en modelos se aplica en el contexto de un agente que interactúa con su entorno, que aprende un modelo del entorno y luego utiliza este modelo para tomar decisiones.
Sources
Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT)
arxiv - Model-based Reinforcement Learning: A Survey - T M. Moerland & al.
Model Based Reinforcement Learning (MBRL) - Hugginface
101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »
Contributeurs: Arianne Arel, Claude Coulombe, Espanol: Jean-Sébastien Zavalone, Patrick Drouin, wiki
