« Reinforcement learning from human feedback » : différence entre les versions
(Page redirigée vers Apprentissage par renforcement et rétroaction humaine) Balise : Nouvelle redirection |
(Aucune différence)
|
Version du 16 juin 2023 à 20:23
Rediriger vers :
Contributeurs: Claude Coulombe, wiki





