« KV Cache » : historique des versions


Sélection du diff : cochez les boutons radio des versions à comparer et appuyez sur entrée ou sur le bouton en bas.
Légende : (actu) = différence avec la dernière version, (diff) = différence avec la version précédente, m = modification mineure.

19 juin 2025

  • actudiff 13:3619 juin 2025 à 13:36Pitpitt discussion contributions 1 045 octets +2 Aucun résumé des modifications
  • actudiff 13:3519 juin 2025 à 13:35Pitpitt discussion contributions 1 043 octets +1 043 Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''KV Cache''' a KV cache stores intermediate key (K) and value (V) computations for reuse during inference (after training), which results in a substantial speed-up when generating text. The downside of a KV cache is that it adds more complexity to the code, increases memory requirements (the main reason I initially didn't include it in the book), and can't be us... »
Récupérée de « https://datafranca.org/wiki/KV_Cache »