« QLoRA » : différence entre les versions

Version du 9 janvier 2024 à 15:34

Quantification des matrices de rang inférieur (adaptation par modèle auxiliaire ou LoRa) par un encodage avec des nombres de plus faible précision.

adaptation par modèle auxiliaire quantifiée

QLoRA

Par exemple, l'encodage peut se faire avec des entiers à 16 bits ou 8 bits au lieu de 32 bits.

quantized low-rank adaptation

QLoRA

Source : arxiv

Version du 9 janvier 2024 à 15:30 (voir la source) Patrickdrouin (discussion \| contributions) Aucun résumé des modifications ← Modification précédente		Version du 9 janvier 2024 à 15:34 (voir la source) Patrickdrouin (discussion \| contributions) Aucun résumé des modifications Modification suivante →
Ligne 28 :		Ligne 28 :


	[[Catégorie:~~vocabulary~~]]		[[Catégorie:Publication]]