« Apprentissage par Renforcement avec retour humain » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 4 : | Ligne 4 : | ||
{{#evt: | {{#evt: | ||
service=youtube | service=youtube | ||
|id=https://www.youtube.com/watch?v= | |id=https://www.youtube.com/watch?v=z7n8bkVynzo | ||
}} | }} | ||
Version du 27 août 2024 à 20:24
en construction
Définition
Français
Apprentissage par Renforcement avec retour humain
RLHF
Anglais
xxxxx