« Apprentissage par renforcement » : différence entre les versions
Aucun résumé des modifications |
|||
Ligne 7 : | Ligne 7 : | ||
== Définition == | == Définition == | ||
L’apprentissage par renforcement (pour Reinforcement Learning) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution. | L’apprentissage par renforcement (pour ''Reinforcement Learning'') fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution. | ||
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations. | Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations. | ||
Notes : | Notes: l'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé. | ||
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs. | Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs. | ||
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux. | L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux. |
Version du 9 mars 2019 à 12:36
Domaine
intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS
Définition
L’apprentissage par renforcement (pour Reinforcement Learning) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.
Notes: l'apprentissage par renforcement s'oppose à l'apprentissage supervisé et à l'apprentissage non supervisé.
Cette méthode d'apprentissage nécessite de très nombreux essais et erreurs.
L'apprentissage par renforcement est utilisé par exemple pour entraîner des machines à jouer à des jeux.
Français
apprentissage par renforcement n. m.
Anglais
reinforcement learning
-->
Source: Grand Dictionnaire Terminologique
Publié : datafranca.org
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche