Apprentissage par Renforcement avec retour humain


Révision datée du 27 août 2024 à 21:22 par Pitpitt (discussion | contributions) (Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

https://www.youtube.com/watch?v=z7n8bkVynzo


Définition

Français

Apprentissage par Renforcement avec retour humain

RLHF

Anglais

xxxxx

Sources

PARLONS IA

Contributeurs: wiki