« Apprentissage par renforcement hors ligne » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l''''[[apprentissage par renforcement]]''', qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps. | L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l''''[[apprentissage par renforcement]]''', qui est une classe de problèmes d''''[[apprentissage automatique]]''' dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps. | ||
==Français== | ==Français== |
Version du 30 juin 2024 à 07:53
Définition
L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
Français
apprentissage par renforcement hors ligne
Anglais
batch reinforcement learning
Sources
Contributeurs: Evan Brach, Jacques Barolet, wiki