« Apprentissage par Renforcement avec retour humain » : différence entre les versions
(Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire ») |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== en construction == | == en construction == | ||
https://www.youtube.com/watch?v= | == Définition == | ||
{{#evt: | |||
service=youtube | |||
|id=https://www.youtube.com/watch?v=7n8bkVynzo | |||
|alignment=center | |||
}} | |||
== Français == | == Français == |
Version du 27 août 2024 à 20:23
en construction
Définition
Français
Apprentissage par Renforcement avec retour humain
RLHF
Anglais
xxxxx