Apprentissage par renforcement hors ligne


Révision datée du 4 février 2021 à 22:08 par Pitpitt (discussion | contributions) (Remplacement de texte — «  [http » par «  * [http »)

Définition

L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Français

apprentissage par renforcement hors ligne

Anglais

batch reinforcement learning


Contributeurs: Evan Brach, Jacques Barolet, wiki