« Adaptation par modèle auxiliaire quantifiée » : différence entre les versions

Dernière version du 5 juillet 2025 à 13:53

Méthode d'adaptation ou de peaufinage d'un modèle d'apprentissage, typiquement d'un grand modèle de langues par adaptation par modèle auxiliaire (en anglais, LoRA) et quantification avec un encodage de plus faible précision.

Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.

adaptation par modèle auxiliaire quantifiée

QLoRA

quantized low-rank adaptation

QLoRA

@@ Ligne 1 : / Ligne 1 : @@
 == Définition ==
-[[Quantification]] des matrices de rang inférieur ([[Adaptation par modèle auxiliaire|adaptation par modèle auxiliaire]] ou [[Adaptation par modèle auxiliaire|LoRa]]) par un encodage avec des nombres de plus faible précision.
+Méthode d'adaptation ou de peaufinage d'un modèle d'apprentissage, typiquement d'un [[grand modèle de langues]] par [[Adaptation par modèle auxiliaire|adaptation par modèle auxiliaire (en anglais, LoRA)]] et [[quantification]] avec un encodage de plus faible précision.
+== Compléments ==
+Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.
 == Français ==
@@ Ligne 7 : / Ligne 10 : @@
 ''' QLoRA '''
-== Compléments ==
-Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.
 == Anglais ==
@@ Ligne 21 : / Ligne 22 : @@
 -->
-<small>
+==Sources==
 == Sources ==
@@ Ligne 28 : / Ligne 29 : @@
 [https://www.tensorflow.org/model_optimization/guide?hl=fr  Source : TensorFlow]
+[[Catégorie:ENGLISH]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
 [[Catégorie:Publication]]