Reinforcement Learning from Human Feedback


Révision datée du 16 juin 2023 à 13:40 par Patrickdrouin (discussion | contributions) (Patrickdrouin a déplacé la page Reinforcement Learning from Human Feedback vers Apprentissage par renforcement et rétroaction humaine)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Page de redirection


Contributeurs: Patrick Drouin