« QLoRA » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(3 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
[[Quantification]] des matrices de rang inférieur ([[Adaptation par modèle auxiliaire|adaptation par modèle auxiliaire]] ou [[Adaptation par modèle auxiliaire|LoRa]]) par un encodage avec des nombres de plus faible précision.
[[Quantification]] des matrices de rang inférieur (voir [[Adaptation par modèle auxiliaire|adaptation par modèle auxiliaire]] ou [[Adaptation par modèle auxiliaire|LoRa]]) par un encodage avec des nombres de plus faible précision.
 
== Compléments ==
Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.  


== Français ==
== Français ==
Ligne 7 : Ligne 10 :
''' QLoRA '''
''' QLoRA '''


== Compléments ==
Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.


== Anglais ==
== Anglais ==
Ligne 21 : Ligne 22 :
-->
-->


<small>
==Sources==


== Sources ==
[https://arxiv.org/abs/2305.14314  Source : arxiv]
[https://arxiv.org/abs/2305.14314  Source : arxiv]


[https://www.tensorflow.org/model_optimization/guide?hl=fr  Source : TensorFlow]


[[Catégorie:ENGLISH]]


 
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:Publication]]

Dernière version du 28 janvier 2024 à 12:43

Définition

Quantification des matrices de rang inférieur (voir adaptation par modèle auxiliaire ou LoRa) par un encodage avec des nombres de plus faible précision.

Compléments

Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.

Français

adaptation par modèle auxiliaire quantifiée

QLoRA


Anglais

quantized low-rank adaptation

QLoRA


Sources

Sources

Source : arxiv

Source : TensorFlow



Contributeurs: Patrick Drouin, wiki