« Intervention en temps d'inférence » : différence entre les versions


Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
L'Intervention du Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. 
L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. 


L'ITI fonctionne en déplaçant les activations du modèle pendant l'[[inférence]], en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).
L'ITI fonctionne en déplaçant les activations du modèle pendant l'[[inférence]], en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).
Ligne 6 : Ligne 6 :
== Français ==
== Français ==
'''Intervention en temps d'inférence'''   
'''Intervention en temps d'inférence'''   


== Anglais ==
== Anglais ==
Ligne 12 : Ligne 11 :


'''ITI'''
'''ITI'''




Ligne 20 : Ligne 18 :




[[Catégorie:publication]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Version du 31 juillet 2023 à 08:17

Définition

L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. 

L'ITI fonctionne en déplaçant les activations du modèle pendant l'inférence, en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).

Français

Intervention en temps d'inférence

Anglais

Inference-time Intervention

ITI


Source : arXiv.org

Contributeurs: Maya Pentsch, wiki