« Politique d'action » : différence entre les versions


(Création de la fiche)
Balise : Éditeur de wikicode 2017
 
Aucun résumé des modifications
 
(43 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Domaine ==
==Définition==
En [[apprentissage par renforcement]], processus de décision qui définit quelle action un agent doit choisir dans un contexte ou un état donné.


[[Category:Vocabulary]]
En général, une politique d'action n'apprend pas explicitement un modèle de l'environnement, ce qui en fait une méthode d'[[apprentissage par renforcement sans modèle]].


[[Category:Vocabulaire]]
==Compléments==
Un algorithme d'apprentissage par renforcement apprend une Politique: État => 𝐴ction, c'est-à-dire une fonction Politique qui à chaque État préconise une Action à exécuter qui maximise les récompenses.


[[Category:Intelligence artificielle]]Intelligence artificielle<br />
Une politique peut aussi être probabiliste: Politique(Action,État) = Probabilité(Action_t = Action| État_t = État) qui est la probabilité que l'agent choisisse d'exécuter Action alores qu'il est dans l'État.


[[Category:Apprentissage profond]]Apprentissage profond<br />
==Français==
'''politique d'action''' 


[[Category:Termino 2019]]
'''politique d'agent'''


<br>
'''politique de prise de décision'''


'''action basée sur une politique'''


'''stratégie d'action'''


== Définition ==
'''stratégie d'agent'''


Processus de décision qui définit quelle action un agent doit choisir dans un contexte donné en apprentissage par renforcement.
==Anglais==
'''action policy'''


'''policy-based action'''


'''policy based action'''


<br>
'''policy-based algorithm'''


'''policy based algorithm'''


'''policy-based method'''


== Français ==
'''policy based method'''


'''politique'''
'''policy'''


'''stratégie'''
==Sources==


Géron, Aurélien (2017) ''Machine Learning avec Scikit-Learn - Mise en œuvre et cas concrets'', Paris, Dunod, 256 pages.


[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement#Politique  Wikipédia - Apprentissage par renforcement]


== Anglais ==
[https://huggingface.co/learn/deep-rl-course/en/unit4/what-are-policy-based-methods Hugging Face - policy-based method]


'''policy'''
[https://par.nsf.gov/servlets/purl/10394713/ IEEE Signal Processing Workshop, Lifan Xu, Ruxin Zheng and Shunqiao Sun - policy based action]
 
[[Utilisateur:Claude COULOMBE | Claude Coulombe, Datafranca.org]]
 
[[Utilisateur:Patrickdrouin  | Termino]]
 
[[Category:Intelligence artificielle]]
[[Category:Apprentissage profond]]
[[Category:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 25 avril 2025 à 03:02

Définition

En apprentissage par renforcement, processus de décision qui définit quelle action un agent doit choisir dans un contexte ou un état donné.

En général, une politique d'action n'apprend pas explicitement un modèle de l'environnement, ce qui en fait une méthode d'apprentissage par renforcement sans modèle.

Compléments

Un algorithme d'apprentissage par renforcement apprend une Politique: État => 𝐴ction, c'est-à-dire une fonction Politique qui à chaque État préconise une Action à exécuter qui maximise les récompenses.

Une politique peut aussi être probabiliste: Politique(Action,État) = Probabilité(Action_t = Action| État_t = État) qui est la probabilité que l'agent choisisse d'exécuter Action alores qu'il est dans l'État.

Français

politique d'action

politique d'agent

politique de prise de décision

action basée sur une politique

stratégie d'action

stratégie d'agent

Anglais

action policy

policy-based action

policy based action

policy-based algorithm

policy based algorithm

policy-based method

policy based method

policy

Sources

Géron, Aurélien (2017) Machine Learning avec Scikit-Learn - Mise en œuvre et cas concrets, Paris, Dunod, 256 pages.

Wikipédia - Apprentissage par renforcement

Hugging Face - policy-based method

IEEE Signal Processing Workshop, Lifan Xu, Ruxin Zheng and Shunqiao Sun - policy based action

Claude Coulombe, Datafranca.org

Termino