« Réglage par instruction » : différence entre les versions


(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' mise au point .... == Anglais == ''' Instruction Tuning''' The main difference betw... »)
 
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
XXXXXXXXX
La principale différence entre le réglage par instructions et le réglage fin supervisé standard réside dans les données sur lesquelles le modèle est entraîné. Alors que le réglage fin supervisé entraîne les modèles sur des exemples d'entrée et leurs sorties correspondantes, le réglage par instructions ajoute des instructions aux exemples d'entrée et de sortie, ce qui permet aux modèles réglés par instructions de s'adapter plus facilement à de nouvelles tâches.


== Français ==
== Français ==
''' XXXXXXXXX ''' mise au point ....
''' Réglage par instruction '''  


== Anglais ==
== Anglais ==
''' Instruction Tuning'''
''' Instruction Tuning'''


  The main difference between instruction tuning and standard supervised fine-tuning lies in the data that the model is trained on. Whereas supervised fine-tuning trains models on input examples and their corresponding outputs, instruction tuning augments input-output examples with instructions, which enables instruction-tuned models to generalize more easily to new tasks.
   
 
<small>
 
[https://nlpnewsletter.substack.com/p/instruction-tuning-vol-1    Source : nlpnewsletter.substack]
[https://nlpnewsletter.substack.com/p/instruction-tuning-vol-1    Source : nlpnewsletter.substack]


Ligne 19 : Ligne 14 :


[[Catégorie:vocabulary]]
[[Catégorie:vocabulary]]
[[Catégorie:publication]]

Version du 14 novembre 2023 à 15:38

Définition

La principale différence entre le réglage par instructions et le réglage fin supervisé standard réside dans les données sur lesquelles le modèle est entraîné. Alors que le réglage fin supervisé entraîne les modèles sur des exemples d'entrée et leurs sorties correspondantes, le réglage par instructions ajoute des instructions aux exemples d'entrée et de sortie, ce qui permet aux modèles réglés par instructions de s'adapter plus facilement à de nouvelles tâches.

Français

Réglage par instruction

Anglais

Instruction Tuning


Source : nlpnewsletter.substack

Contributeurs: Marie Alfaro, wiki