Optimisation des préférences en fonction du rapport des cotes


Révision datée du 2 mai 2024 à 07:35 par Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''ORPO ''' '''Monolithic Preference Optimization without Reference Model''' == Source == [https://arxiv.org/abs/2403.07691 Source : arxiv] Catégorie:vocabulary »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

Définition

XXXXXXXXX

Français

XXXXXXXXX

Anglais

ORPO 

Monolithic Preference Optimization without Reference Model


Source

Source : arxiv

Contributeurs: Arianne , wiki