Adaptation par modèle auxiliaire quantifiée


Révision datée du 5 juillet 2025 à 13:43 par Claude COULOMBE (discussion | contributions) (Claude COULOMBE a déplacé la page QLoRA vers Adaptation par modèle auxiliaire quantifiée par-dessus une redirection)

Définition

Quantification des matrices de rang inférieur (voir adaptation par modèle auxiliaire ou LoRa) par un encodage avec des nombres de plus faible précision.

Compléments

Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.

Français

adaptation par modèle auxiliaire quantifiée

QLoRA


Anglais

quantized low-rank adaptation

QLoRA


Sources

Sources

Source : arxiv

Source : TensorFlow