« Apprentissage par renforcement à base de modèles » : différence entre les versions


(Page créée avec « ==Définition== L'apprentissage par renforcement basé sur un modèle ne diffère de son homologue sans modèle que par l'apprentissage d'un modèle de dynamique, mais cela a des effets substantiels en aval sur la manière dont les décisions sont prises. En apprentissage par renforcement, l’algorithme apprend un comportement à partir d’expériences répétées, de façon à optimiser les récompenses reçues au cours du temps. Tout comme l’Apprentissa... »)
 
Aucun résumé des modifications
 
(13 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
L'[[apprentissage par renforcement]] à base de [[modèle|modèles]] s'applique dans le cadre d'un [[agent]] interagissant avec son environnement qui apprend un modèle dudit environnement, puis qui exploite ce modèle pour sa prise de décisions.
==Compléments==
Un agent tente, par essais et erreurs, de résoudre un problème en accumulant des données sur ses actions et sur l'état de l’environnement qui en résulte. Avec ces données, l'agent crée un modèle dynamique, pour raisonner sur son environnement. À partir de ce modèle qui évolue dans le temps, l'agent peut ainsi prendre des décisions en prédisant leurs effets. Ce processus itératif fait que le modèle s'améliore graduellement, tout comme les décisions prises par l'agent.
<hr/>
L'apprentissage par renforcement basé sur un modèle ne diffère de son homologue sans modèle que par l'apprentissage d'un modèle de dynamique, mais cela a des effets substantiels en aval sur la manière dont les décisions sont prises.
L'apprentissage par renforcement basé sur un modèle ne diffère de son homologue sans modèle que par l'apprentissage d'un modèle de dynamique, mais cela a des effets substantiels en aval sur la manière dont les décisions sont prises.


Voir : [[apprentissage par renforcement sans modèle]], [[apprentissage par renforcement]], [[modèle]].


En apprentissage par renforcement, l’algorithme apprend un comportement à partir d’expériences répétées, de façon à optimiser les récompenses reçues au cours du temps. Tout comme l’[[Apprentissage non supervisé|apprentissage non supervisé,]] l’apprentissage par renforcement n’a pas besoin de données étiquetées.
==Français==
'''apprentissage par renforcement à base de modèles'''


Typiquement, un agent intelligent, qui est plongé au sein d’un environnement, prend une décision ou réalise une action en fonction de son état courant et de l’observation de son environnement. En retour de l’action de l’agent, l’environnement procure à l’agent une récompense ou une punition.
'''apprentissage par renforcement basé sur un modèle'''


On peut voir l’apprentissage par renforcement comme un jeu d’essais et d’erreurs dont le but est de déterminer les actions qui vont maximiser les gains d’un agent intelligent. Il élaborera ainsi un comportement optimal, appelé stratégie ou politique, qui est une fonction associant à l’état courant l’action à exécuter.
'''apprentissage par renforcement avec modèles'''


Voir aussi:
==Anglais==
'''model based reinforcement learning'''


* [[apprentissage par fonction Q]]
'''model based RL'''
* apprentissage avec [[politique d'action]].
* [[apprentissage par renforcement inverse|'''apprentissage par renforcement inverse''']]
 
==Compléments==


'''MBRL'''


==Français==
==Español==
'''apprentissage par renforcement à base de modèles'''


==Anglais==
''''' aprendizaje por refuerzo basado en modelos '''''  
'''Model Based Reinforcement Learning'''


'''MBRL'''
''El aprendizaje por refuerzo basado en modelos se aplica en el contexto de un agente que interactúa con su entorno, que aprende un modelo del entorno y luego utiliza este modelo para tomar decisiones.''  


==Sources==
==Sources==
Ligne 38 : Ligne 43 :
[https://huggingface.co/learn/deep-rl-course/en/unitbonus3/model-based '' Model Based Reinforcement Learning (MBRL)'' - Hugginface]
[https://huggingface.co/learn/deep-rl-course/en/unitbonus3/model-based '' Model Based Reinforcement Learning (MBRL)'' - Hugginface]


[[Catégorie:Publication]] FRANÇAIS]]
 
{{Modèle:101}}
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
 
[[Catégorie:101]]

Dernière version du 21 juillet 2025 à 15:07

Définition

L'apprentissage par renforcement à base de modèles s'applique dans le cadre d'un agent interagissant avec son environnement qui apprend un modèle dudit environnement, puis qui exploite ce modèle pour sa prise de décisions.

Compléments

Un agent tente, par essais et erreurs, de résoudre un problème en accumulant des données sur ses actions et sur l'état de l’environnement qui en résulte. Avec ces données, l'agent crée un modèle dynamique, pour raisonner sur son environnement. À partir de ce modèle qui évolue dans le temps, l'agent peut ainsi prendre des décisions en prédisant leurs effets. Ce processus itératif fait que le modèle s'améliore graduellement, tout comme les décisions prises par l'agent.


L'apprentissage par renforcement basé sur un modèle ne diffère de son homologue sans modèle que par l'apprentissage d'un modèle de dynamique, mais cela a des effets substantiels en aval sur la manière dont les décisions sont prises.

Voir : apprentissage par renforcement sans modèle, apprentissage par renforcement, modèle.

Français

apprentissage par renforcement à base de modèles

apprentissage par renforcement basé sur un modèle

apprentissage par renforcement avec modèles

Anglais

model based reinforcement learning

model based RL

MBRL

Español

aprendizaje por refuerzo basado en modelos

El aprendizaje por refuerzo basado en modelos se aplica en el contexto de un agente que interactúa con su entorno, que aprende un modelo del entorno y luego utiliza este modelo para tomar decisiones.

Sources

Apprentissage par renforcement à base de modèles pour le contrôle de processus de décision semi-markoviens déterministes par morceaux, partiellement observables Orlane Le Quellennec 2023

Polytechnique Montréal

Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT)

arxiv - Model-based Reinforcement Learning: A Survey - T M. Moerland & al.

Model Based Reinforcement Learning (MBRL) - Hugginface


101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle » Ligne bleue2.jpg