« LLM-as-a-judge » : historique des versions


Sélection du diff : cochez les boutons radio des versions à comparer et appuyez sur entrée ou sur le bouton en bas.
Légende : (actu) = différence avec la dernière version, (diff) = différence avec la version précédente, m = modification mineure.

23 février 2026

  • actudiff 14:0123 février 2026 à 14:01Arianne discussion contributions 1 042 octets +1 042 Page créée avec « == en construction == == Définition == xxxxxx == Français == ''' GML en tant que juge''' ''' GML comme juge''' == Anglais == ''' LLM-as-a-judge''' <!--A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation... »