Intervention en temps d'inférence
Définition
L'Intervention en Temps d'Inférence (ITI) est une technique conçue pour améliorer la véracité des grands modèles de langage.
L'ITI fonctionne en déplaçant les activations du modèle pendant l'inférence, en suivant un ensemble de directions à travers un nombre limité de têtes d'attention (Un ensemble composé des matrices).
Français
Intervention en temps d'inférence
Anglais
Inference-time Intervention
ITI
Contributeurs: Maya Pentsch, wiki