« Reward Hacking Problem » : historique des versions


Sélection du diff : cochez les boutons radio des versions à comparer et appuyez sur entrée ou sur le bouton en bas.
Légende : (actu) = différence avec la dernière version, (diff) = différence avec la version précédente, m = modification mineure.

8 juillet 2025

  • actudiff 15:488 juillet 2025 à 15:48Arianne discussion contributions 1 191 octets +695 Aucun résumé des modifications
  • actudiff 13:138 juillet 2025 à 13:13Arianne discussion contributions 496 octets +496 Page créée avec « == en construction == == Définition == xxxxxxx Voir aussi '''Best-of-N Strategy''' == Français == ''' XXXXXX''' == Anglais == ''' Reward Hacking Problem''' ''' Reward Hacking''' ''' Specification Gaming''' == Sources == [https://arxiv.org/html/2502.12668v1 Source : arxiv] [https://medium.com/@prdeepak.babu/reward-hacking-in-large-language-models-llms-c57abbc0cde7 Source : Medium] [https://en.wikipedia.org/wiki/Reward_hacking Source : Wikipedi... »