« Apprentissage par renforcement sans modèle » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵↵==Sources== » par « ==Sources== ») |
||
(Une version intermédiaire par le même utilisateur non affichée) | |||
Ligne 16 : | Ligne 16 : | ||
'''MFRL''' | '''MFRL''' | ||
==Sources== | ==Sources== | ||
Ligne 22 : | Ligne 21 : | ||
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond Wikipedia - Apprentissage par renforcement profond] | [https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond Wikipedia - Apprentissage par renforcement profond] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | |||
[[Catégorie: |
Dernière version du 30 août 2024 à 14:02
Définition
L'apprentissage par renforcement sans modèle est une catégorie d'algorithmes d'apprentissage par renforcement qui ne nécessitent pas de modèle de l'environnement pour fonctionner.
Compléments
Un exemple d'apprentissage par renforcement sans modèle est l'apprentissage par fonction Q.
Voir : apprentissage par renforcement à base de modèles.
Français
apprentissage par renforcement sans modèle
Anglais
Model-Free Reinforcement Learning
Model-Free RL
MFRL
Sources
Apprentissage par Renforcement sans Modèle et avec Action Continue, Degris et al. 2012
Contributeurs: Claude Coulombe, Patrick Drouin, wiki