« Apprentissage par renforcement hors ligne » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :
[[Catégorie:Intelligence artificielle]]
[[Catégorie:Intelligence artificielle]]
[[Catégorie:IBM]]
[[Catégorie:IBM]]
[[Catégorie:anglais-français]]
[[Catégorie:anglais-français
 
==Définition==
==Définition==
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.
L'apprentissage par renforcement hors ligne (''batch reinforcement learning'') est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Version du 8 octobre 2019 à 19:52

[[Catégorie:anglais-français

Définition

L'apprentissage par renforcement hors ligne (batch reinforcement learning) est un cas particulier de l'apprentissage par renforcement, qui est une classe de problèmes d'apprentissage automatique dont l'objectif est de déterminer à partir d'expériences une stratégie (ou politique) permettant à un agent de maximiser une récompense numérique au cours du temps.

Français

apprentissage par renforcement hors ligne n.m.

Anglais

batch reinforcement learning


Source : Wikipedia IA



Contributeurs: Jacques Barolet, wiki