Apprentissage par renforcement hors ligne
Domaine
Définition
L'apprentissage par renforcement hors ligne (ou batch) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
Français
Apprentissage par renforcement hors ligne
Anglais
XXXXXXXXXXXXXXX
Contributeurs: Evan Brach, Jacques Barolet, wiki