« Apprentissage par renforcement hors ligne » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 7 : | Ligne 7 : | ||
[[Catégorie:scotty2]] | [[Catégorie:scotty2]] | ||
[[Category:GRAND LEXIQUE FRANÇAIS]] | [[Category:GRAND LEXIQUE FRANÇAIS]] | ||
==Définition== | ==Définition== | ||
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps. | L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps. | ||
==Français== | ==Français== | ||
'''apprentissage par renforcement hors ligne''' n.m. | '''apprentissage par renforcement hors ligne''' n.m. | ||
==Anglais== | ==Anglais== | ||
'''batch reinforcement learning''' | '''batch reinforcement learning''' | ||
[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA] | [https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_hors_ligne Source : Wikipedia IA] |
Version du 15 juin 2019 à 09:54
Domaine
Intelligence artificielle
Apprentissage automatique
Définition
L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
Français
apprentissage par renforcement hors ligne n.m.
Anglais
batch reinforcement learning
Contributeurs: Evan Brach, Jacques Barolet, wiki