« Apprentissage par renforcement sans modèle » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵↵==Sources== » par « ==Sources== ») |
||
(2 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 11 : | Ligne 11 : | ||
==Anglais== | ==Anglais== | ||
'''Model Free Reinforcement Learning''' | '''Model-Free Reinforcement Learning''' | ||
'''Model Free RL''' | '''Model-Free RL''' | ||
'''MFRL''' | '''MFRL''' | ||
==Sources== | ==Sources== | ||
Ligne 22 : | Ligne 21 : | ||
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond Wikipedia - Apprentissage par renforcement profond] | [https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond Wikipedia - Apprentissage par renforcement profond] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | |||
[[Catégorie: |
Dernière version du 30 août 2024 à 14:02
Définition
L'apprentissage par renforcement sans modèle est une catégorie d'algorithmes d'apprentissage par renforcement qui ne nécessitent pas de modèle de l'environnement pour fonctionner.
Compléments
Un exemple d'apprentissage par renforcement sans modèle est l'apprentissage par fonction Q.
Voir : apprentissage par renforcement à base de modèles.
Français
apprentissage par renforcement sans modèle
Anglais
Model-Free Reinforcement Learning
Model-Free RL
MFRL
Sources
Apprentissage par Renforcement sans Modèle et avec Action Continue, Degris et al. 2012
Contributeurs: Claude Coulombe, Patrick Drouin, wiki