« Apprentissage par renforcement hors ligne » : différence entre les versions

Version du 1 juin 2019 à 21:59

Domaine

Définition

L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Français

apprentissage par renforcement hors ligne n.m.

Anglais

batch reinforcement learning

Source : Wikipedia IA

@@ Ligne 6 : / Ligne 6 : @@
 [[Catégorie:Apprentissage automatique]]
 [[Catégorie:scotty]]
+[[Catégorie:9]]
 <br>
@@ Ligne 13 : / Ligne 14 : @@
 ==Français==
-'''apprentissage par renforcement hors ligne'''
+'''apprentissage par renforcement hors ligne'''  n.m.