« Apprentissage par Renforcement avec retour humain » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 20 : Ligne 20 :
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]


{{Modèle:Quantique}}
[[Catégorie:Q2]]


[[Catégorie:vocabulaire]]
[[Catégorie:vocabulaire]]

Version du 27 août 2024 à 21:25

en construction

Définition


Français

Apprentissage par Renforcement avec retour humain

RLHF

Anglais

xxxxx

Sources

PARLONS IA

Contributeurs: wiki