« Intervention en temps d'inférence » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(8 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
L'Invention du Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. 
L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. 


L'ITI fonctionne en déplaçant les activations du modèle pendant l'[[inférence]], en suivant un ensemble de directions à travers un nombre limité de têtes d'attention.
L'ITI fonctionne en déplaçant les activations du modèle pendant l'[[inférence]], en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).


== Français ==
== Français ==
'''Invention du Temps d'Inférence'''
'''Intervention en temps d'inférence'''
 
'''ITI'''


== Anglais ==
== Anglais ==
Ligne 14 : Ligne 12 :
'''ITI'''
'''ITI'''


A technique designed to enhance the truthfulness of large language models. 


<small>
 
==Sources==


[https://arxiv.org/abs/2306.03341#:~:text=We%20introduce%20Inference%2DTime%20Intervention,limited%20number%20of%20attention%20heads.  Source : arXiv.org ]
[https://arxiv.org/abs/2306.03341#:~:text=We%20introduce%20Inference%2DTime%20Intervention,limited%20number%20of%20attention%20heads.  Source : arXiv.org ]




[[Catégorie:publication]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 27 janvier 2024 à 22:51

Définition

L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. 

L'ITI fonctionne en déplaçant les activations du modèle pendant l'inférence, en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).

Français

Intervention en temps d'inférence

Anglais

Inference-time Intervention

ITI


Sources

Source : arXiv.org

Contributeurs: Maya Pentsch, wiki