« Apprentissage par renforcement hors ligne » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 9 : Ligne 9 :


==Définition==
==Définition==
L'apprentissage par renforcement hors ligne (ou ''batch learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
L'apprentissage par renforcement hors ligne (ou ''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.




Ligne 19 : Ligne 19 :


==Anglais==
==Anglais==
'''XXXXXXXXXXXXXXX '''
'''batch reinforcement learning'''
 
 




[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA]
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA]

Version du 15 mai 2019 à 19:30

Domaine


Définition

L'apprentissage par renforcement hors ligne (ou batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.


Français

Apprentissage par renforcement hors ligne



Anglais

batch reinforcement learning


Source : Wikipedia IA

Contributeurs: Evan Brach, Jacques Barolet, wiki