« Apprentissage par Renforcement avec retour humain » : différence entre les versions
(Page créée avec « == en construction == https://www.youtube.com/watch?v=z7n8bkVynzo == Définition == == Français == ''' Apprentissage par Renforcement avec retour humain''' '''RLHF''' == Anglais == ''' xxxxx ''' ==Sources== [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] {{Modèle:Quantique}} Catégorie:Q2 Catégorie:vocabulaire ») |
Aucun résumé des modifications |
||
(8 versions intermédiaires par un autre utilisateur non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== en construction == | == en construction == | ||
== Définition == | == Définition == | ||
Pour pitpit: la page existe déjà (voir la page Apprentissage par renforcement et rétroaction humaine). Redirection à faire? | |||
{{#evt: service=youtube |id=https://www.youtube.com/watch?v=z7n8bkVynzo }} | |||
== Français == | == Français == | ||
Ligne 13 : | Ligne 12 : | ||
== Anglais == | == Anglais == | ||
''' xxxxx ''' | ''' xxxxx ''' | ||
==Sources== | ==Sources== | ||
[https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] | [https://www.louisbouchard.ca/blog-ia/rlhf-et-rlaif PARLONS IA ] | ||
[[Catégorie:vocabulaire]] | [[Catégorie:vocabulaire]] |
Dernière version du 3 octobre 2024 à 17:18
en construction
Définition
Pour pitpit: la page existe déjà (voir la page Apprentissage par renforcement et rétroaction humaine). Redirection à faire?
Français
Apprentissage par Renforcement avec retour humain
RLHF
Anglais
xxxxx