« Apprentissage par renforcement sans modèle » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(8 versions intermédiaires par 3 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
L'apprentissage par renforcement sans modèle est une catégorie d'algorithmes d'apprentissage par renforcement qui ne nécessitent pas de modèle de l'environnement pour fonctionner. | L'apprentissage par renforcement sans modèle est une catégorie d'[[Algorithme|algorithmes]] d'[[apprentissage par renforcement]] qui ne nécessitent pas de [[modèle]] de l'environnement pour fonctionner. | ||
==Compléments== | ==Compléments== | ||
Un exemple d'apprentissage par renforcement sans modèle est l'[[apprentissage par fonction Q]]. | |||
Voir : [[apprentissage par renforcement à base de modèles]] | |||
Voir : [[apprentissage par renforcement à base de modèles]] | |||
==Français== | ==Français== | ||
Ligne 11 : | Ligne 11 : | ||
==Anglais== | ==Anglais== | ||
''' | '''model-free reinforcement learning''' | ||
''' | '''model-free RL''' | ||
'''MFRL''' | '''MFRL''' | ||
==Sources== | ==Sources== | ||
Ligne 22 : | Ligne 21 : | ||
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond Wikipedia - Apprentissage par renforcement profond] | [https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond Wikipedia - Apprentissage par renforcement profond] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | |||
[[Catégorie: | [[Catégorie:101]] |
Dernière version du 8 février 2025 à 14:15
Définition
L'apprentissage par renforcement sans modèle est une catégorie d'algorithmes d'apprentissage par renforcement qui ne nécessitent pas de modèle de l'environnement pour fonctionner.
Compléments
Un exemple d'apprentissage par renforcement sans modèle est l'apprentissage par fonction Q.
Voir : apprentissage par renforcement à base de modèles
Français
apprentissage par renforcement sans modèle
Anglais
model-free reinforcement learning
model-free RL
MFRL
Sources
Apprentissage par Renforcement sans Modèle et avec Action Continue, Degris et al. 2012
Contributeurs: Arianne , Claude Coulombe, Patrick Drouin, wiki
