« Apprentissage par Renforcement avec retour humain » : différence entre les versions


(Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire »)
 
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== en construction ==
== en construction ==


https://www.youtube.com/watch?v=z7n8bkVynzo
== Définition ==
{{#evt:
service=youtube
|id=https://www.youtube.com/watch?v=7n8bkVynzo
|alignment=center
}}


== Définition ==


== Français ==
== Français ==

Version du 27 août 2024 à 21:23

en construction

Définition


Français

Apprentissage par Renforcement avec retour humain

RLHF

Anglais

xxxxx

Sources

PARLONS IA

Contributeurs: wiki