« Intervention en temps d'inférence » : différence entre les versions
m (Pitpitt a déplacé la page Inference-time Intervention vers Intervention en temps d'inférence) |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
(Une version intermédiaire par le même utilisateur non affichée) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
L'Intervention | L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage. | ||
L'ITI fonctionne en déplaçant les activations du modèle pendant l'[[inférence]], en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices). | L'ITI fonctionne en déplaçant les activations du modèle pendant l'[[inférence]], en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices). | ||
Ligne 6 : | Ligne 6 : | ||
== Français == | == Français == | ||
'''Intervention en temps d'inférence''' | '''Intervention en temps d'inférence''' | ||
== Anglais == | == Anglais == | ||
Ligne 15 : | Ligne 14 : | ||
==Sources== | |||
[https://arxiv.org/abs/2306.03341#:~:text=We%20introduce%20Inference%2DTime%20Intervention,limited%20number%20of%20attention%20heads. Source : arXiv.org ] | [https://arxiv.org/abs/2306.03341#:~:text=We%20introduce%20Inference%2DTime%20Intervention,limited%20number%20of%20attention%20heads. Source : arXiv.org ] | ||
[[Catégorie: | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 27 janvier 2024 à 22:51
Définition
L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage.
L'ITI fonctionne en déplaçant les activations du modèle pendant l'inférence, en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).
Français
Intervention en temps d'inférence
Anglais
Inference-time Intervention
ITI
Sources
Contributeurs: Maya Pentsch, wiki