LLM-as-a-judge


Révision datée du 23 février 2026 à 14:01 par Arianne (discussion | contributions) (Page créée avec « == en construction == == Définition == xxxxxx == Français == ''' GML en tant que juge''' ''' GML comme juge''' == Anglais == ''' LLM-as-a-judge''' <!--A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

Définition

xxxxxx

Français

GML en tant que juge

GML comme juge

Anglais

LLM-as-a-judge


Sources

Source : arxiv

Source : towards data science

Source : Wikipedia

Contributeurs: Arianne Arel