Fonction d'avantage


Révision datée du 4 mars 2026 à 16:49 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

En apprentissage par renforcement, ce type de fonction donne un avantage relatif, mais qui n'est pas absolu. La fonction d’avantage quantifie la contribution d’une action à la récompense espérée sous une politique donnée.

Voir aussi apprentissage par renforcement

Français

fonction d'avantage

Anglais

advantage function

Sources

fonction d'avantage - Vandewiele et Delepoulle 2023

Source : Arxiv

Source : Emergent Mind

Contributeurs: Arianne Arel, Patrick Drouin, wiki