« Apprentissage par renforcement avec retour humain » : différence entre les versions
(Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire ») |
m (Claude COULOMBE a déplacé la page Apprentissage par Renforcement avec retour humain vers Apprentissage par renforcement avec retour humain) |
||
(10 versions intermédiaires par 3 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
#REDIRECTION [[Apprentissage par renforcement avec rétroaction humaine]] | |||
Dernière version du 13 mai 2025 à 14:18
Rediriger vers :
Contributeurs: Arianne , Claude Coulombe, wiki
