« Apprentissage par Renforcement avec retour humain » : différence entre les versions


(Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire »)
 
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(7 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
== en construction ==
== en construction ==
https://www.youtube.com/watch?v=z7n8bkVynzo


== Définition ==
== Définition ==
{{#evt:  service=youtube  |id=https://www.youtube.com/watch?v=z7n8bkVynzo  }}


== Français ==
== Français ==
Ligne 13 : Ligne 11 :
== Anglais ==
== Anglais ==
''' xxxxx '''
''' xxxxx '''
==Sources==
==Sources==
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif  PARLONS IA ]


{{Modèle:Quantique}}
[[Catégorie:Q2]]


[[Catégorie:vocabulaire]]
[[Catégorie:vocabulaire]]

Dernière version du 30 août 2024 à 14:50

en construction

Définition

Français

Apprentissage par Renforcement avec retour humain

RLHF

Anglais

xxxxx

Sources

PARLONS IA

Contributeurs: wiki