« Apprentissage par renforcement avec retour humain » : différence entre les versions


(Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire »)
 
 
(10 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== en construction ==
#REDIRECTION [[Apprentissage par renforcement avec rétroaction humaine]]
 
https://www.youtube.com/watch?v=z7n8bkVynzo
 
 
== Définition ==
 
== Français ==
''' Apprentissage par Renforcement avec retour humain'''
 
'''RLHF'''
 
== Anglais ==
''' xxxxx '''
 
==Sources==
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]
 
{{Modèle:Quantique}}
 
[[Catégorie:Q2]]
 
[[Catégorie:vocabulaire]]

Dernière version du 13 mai 2025 à 14:18

Contributeurs: Arianne , Claude Coulombe, wiki