« Apprentissage par Renforcement avec retour humain » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(2 versions intermédiaires par le même utilisateur non affichées)
Ligne 11 : Ligne 11 :
== Anglais ==
== Anglais ==
''' xxxxx '''
''' xxxxx '''
==Sources==
==Sources==
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]

Dernière version du 30 août 2024 à 14:50

en construction

Définition

Français

Apprentissage par Renforcement avec retour humain

RLHF

Anglais

xxxxx

Sources

PARLONS IA

Contributeurs: wiki