« Apprentissage par renforcement » : différence entre les versions

Version du 9 mars 2019 à 13:38

Domaine

intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS

Définition

L’apprentissage par renforcement (pour Reinforcement Learning) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.

Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.

Note: l'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.

Français

apprentissage par renforcement n. m.

Anglais

reinforcement learning

--> Source: Grand Dictionnaire Terminologique

Publié : datafranca.org

@@ Ligne 11 : / Ligne 11 : @@
 Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l''''apprentissage supervisé''' et de l''''apprentissage non supervisé''' par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.
-Notes: l'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.
+Note: l'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.
 <br />
 <br />

« Apprentissage par renforcement » : différence entre les versions