Apprentissage par Renforcement avec retour humain


Révision datée du 3 octobre 2024 à 17:18 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

Définition

Pour pitpit: la page existe déjà (voir la page Apprentissage par renforcement et rétroaction humaine). Redirection à faire?

Français

Apprentissage par Renforcement avec retour humain

RLHF

Anglais

xxxxx

Sources

PARLONS IA

Contributeurs: Arianne , wiki