« Apprentissage par renforcement » : différence entre les versions


Aucun résumé des modifications
Ligne 7 : Ligne 7 :


== Définition ==
== Définition ==
L’apprentissage par renforcement (pour Reinforcement Learning) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.
L’apprentissage par renforcement (pour ''Reinforcement Learning'') fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.


Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.


Notes : L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Notes: l'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.   
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.   

Version du 9 mars 2019 à 13:36

Domaine

intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS


Définition

L’apprentissage par renforcement (pour Reinforcement Learning) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.

Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.

Notes: l'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé. Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs. L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.

Français

apprentissage par renforcement n. m.



Anglais

reinforcement learning



--> Source: Grand Dictionnaire Terminologique

Publié : datafranca.org