Apprentissage par renforcement hors ligne : Différence entre versions


De DataFranca
Balise : éditeur de source 2017
Balise : éditeur de source 2017
 
(Une révision intermédiaire par le même utilisateur non affichée)
Ligne 1 : Ligne 1 :
 
[[Catégorie:Intelligence artificielle]]
 
[[Catégorie:Intelligence artificielle]]
[[Catégorie:IBM]]
+
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:anglais-français
 
 
==Définition==
 
==Définition==
 
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
 
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Version actuelle datée du 10 octobre 2019 à 12:32

Définition

L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Français

apprentissage par renforcement hors ligne n.m.

Anglais

batch reinforcement learning


Source : Wikipedia IA

Contributeurs : Jacques Barolet, admin