« QLoRA » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 23 : | Ligne 23 : | ||
<small> | <small> | ||
== Sources == | |||
[https://arxiv.org/abs/2305.14314 Source : arxiv] | [https://arxiv.org/abs/2305.14314 Source : arxiv] | ||
[https://www.tensorflow.org/model_optimization/guide?hl=fr Source : TensorFlow] | |||
Version du 9 janvier 2024 à 14:54
Définition
Quantification des matrices de rang inférieur (adaptation par modèle auxiliaire ou LoRa) par un encodage avec des nombres de plus faible précision.
Français
adaptation par modèle auxiliaire quantifiée
QLoRA
Compléments
Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.
Anglais
quantized low-rank adaptation
QLoRA
Sources
Contributeurs: Patrick Drouin, wiki