« Adaptation par modèle auxiliaire » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵↵==Sources== » par « ==Sources== ») |
||
(15 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
[[ | Technique d'adaptation ou [[peaufinage]] des résultats d'un grand [[modèle préentraîné]] en utilisant un modèle auxiliaire de petite taille. | ||
Techniquement, ce modèle auxiliaire prend la forme une matrice de rang inférieur. | |||
Cette technique peut s'appliquer à la fois aux [[grand modèle de langues|grands modèles de langues]] et aux grands modèles en [[vision artificielle]]. | |||
== Compléments == | == Compléments == | ||
L'idée est celle de l'[[apprentissage par transfert]], c.-à-d. qu'une fois que vous avez appris la tâche générale avec la pré-entraînement, on peut faire le [[peaufinage]] avec beaucoup moins de données. | |||
Dans de processus de [[peaufinage]], un modèle de petite taille (matrice de rang inférieur) est entraîné avec des données spécifiques à l’application alors que le grand modèle associé demeure inchangé. Ce petit modèle auxiliaire aura une influence sur les performances du grand modèle. | Dans de processus de [[peaufinage]], un modèle de petite taille (matrice de rang inférieur) est entraîné avec des données spécifiques à l’application alors que le grand modèle associé demeure inchangé. Ce petit modèle auxiliaire aura une influence sur les performances du grand modèle. | ||
Note: Comme dans le cas de « [[blockchain]] » maladroitement traduit par « chaîne de blocs », on a créé en anglais un terme « low-rank adaptation » à partir d'un détail d'implémentation informatique. Nous pensons que le concept de | Note: Comme dans le cas de « [[blockchain]] » maladroitement traduit par « chaîne de blocs », on a créé en anglais un terme « low-rank adaptation » à partir d'un détail d'implémentation informatique. Nous pensons que le concept de modèle auxiliaire est plus compréhensible et d'emploi plus général. | ||
Voir aussi: [[Génération augmentée d'information contextuelle]] | |||
== Français == | == Français == | ||
'''adaptation par modèle auxiliaire''' | '''adaptation par modèle auxiliaire''' | ||
'''APMA''' | '''APMA''' | ||
'''affinage par modèle auxiliaire''' | |||
'''APMA''' | |||
'''adaptation par matrice de rang inférieur''' | '''adaptation par matrice de rang inférieur''' | ||
''' | '''APMRI''' | ||
'''peaufinage par modèle auxiliaire''' | |||
'''PPMA''' | |||
'''adaptation de rangs faibles''' | '''adaptation de rangs faibles''' | ||
'''LoRA''' | '''LoRA''' | ||
== Anglais == | == Anglais == | ||
Ligne 25 : | Ligne 39 : | ||
'''LoRA''' | '''LoRA''' | ||
==Sources== | |||
[https://fr.ml6.eu/blogpost/harnessing-the-power-of-foundation-models-for-your-business-with-lora Source : ML6] | [https://fr.ml6.eu/blogpost/harnessing-the-power-of-foundation-models-for-your-business-with-lora Source : ML6] | ||
Ligne 33 : | Ligne 46 : | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:Intelligence artificielle]] | |||
[[Catégorie:101]] |
Dernière version du 30 août 2024 à 13:54
Définition
Technique d'adaptation ou peaufinage des résultats d'un grand modèle préentraîné en utilisant un modèle auxiliaire de petite taille.
Techniquement, ce modèle auxiliaire prend la forme une matrice de rang inférieur.
Cette technique peut s'appliquer à la fois aux grands modèles de langues et aux grands modèles en vision artificielle.
Compléments
L'idée est celle de l'apprentissage par transfert, c.-à-d. qu'une fois que vous avez appris la tâche générale avec la pré-entraînement, on peut faire le peaufinage avec beaucoup moins de données.
Dans de processus de peaufinage, un modèle de petite taille (matrice de rang inférieur) est entraîné avec des données spécifiques à l’application alors que le grand modèle associé demeure inchangé. Ce petit modèle auxiliaire aura une influence sur les performances du grand modèle.
Note: Comme dans le cas de « blockchain » maladroitement traduit par « chaîne de blocs », on a créé en anglais un terme « low-rank adaptation » à partir d'un détail d'implémentation informatique. Nous pensons que le concept de modèle auxiliaire est plus compréhensible et d'emploi plus général.
Voir aussi: Génération augmentée d'information contextuelle
Français
adaptation par modèle auxiliaire
APMA
affinage par modèle auxiliaire
APMA
adaptation par matrice de rang inférieur
APMRI
peaufinage par modèle auxiliaire
PPMA
adaptation de rangs faibles
LoRA
Anglais
low-rank adaptation
LoRA
Sources
Contributeurs: Claude Coulombe, Patrick Drouin, wiki