« QLoRA » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 23 : Ligne 23 :
<small>
<small>


== Sources ==
[https://arxiv.org/abs/2305.14314  Source : arxiv]
[https://arxiv.org/abs/2305.14314  Source : arxiv]
[https://www.tensorflow.org/model_optimization/guide?hl=fr  Source : TensorFlow]





Version du 9 janvier 2024 à 14:54

Définition

Quantification des matrices de rang inférieur (adaptation par modèle auxiliaire ou LoRa) par un encodage avec des nombres de plus faible précision.

Français

adaptation par modèle auxiliaire quantifiée

QLoRA

Compléments

Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.

Anglais

quantized low-rank adaptation

QLoRA


Sources

Source : arxiv

Source : TensorFlow

Contributeurs: Patrick Drouin, wiki