« Intervention en temps d'inférence » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Inference-time Intervention''' '''ITI''' A technique designed to... ») |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== | == Définition == | ||
L'Invention du Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. | |||
L'ITI fonctionne en déplaçant les activations du modèle pendant l'inférence, en suivant un ensemble de directions à travers un nombre limité de têtes d'attention. | |||
== Français == | == Français == | ||
''' | '''Invention du Temps d'Inférence''' | ||
'''ITI''' | |||
== Anglais == | == Anglais == | ||
''' | '''Inference-time Intervention''' | ||
'''ITI''' | '''ITI''' | ||
Ligne 16 : | Ligne 18 : | ||
<small> | <small> | ||
[ | [https://arxiv.org/abs/2306.03341#:~:text=We%20introduce%20Inference%2DTime%20Intervention,limited%20number%20of%20attention%20heads. Source : arXiv.org ] | ||
[[Catégorie: | [[Catégorie:publication]] |
Version du 24 juillet 2023 à 04:10
Définition
L'Invention du Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage.
L'ITI fonctionne en déplaçant les activations du modèle pendant l'inférence, en suivant un ensemble de directions à travers un nombre limité de têtes d'attention.
Français
Invention du Temps d'Inférence
ITI
Anglais
Inference-time Intervention
ITI
A technique designed to enhance the truthfulness of large language models.
Contributeurs: Maya Pentsch, wiki