« Apprentissage par renforcement » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 11 : Ligne 11 :
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.


Notes
Notes : L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.   
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.   

Version du 9 mars 2019 à 12:14

Domaine

intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS


Définition

L’apprentissage par renforcement (pour Reinforcement Learning) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.

Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.

Notes : L'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé. Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs. L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.

Français

apprentissage par renforcement n. m.



Anglais

reinforcement learning



--> Source: Grand Dictionnaire Terminologique

Publié : datafranca.org