« Apprentissage par renforcement » : différence entre les versions
Ligne 9 : | Ligne 9 : | ||
L’apprentissage par renforcement, pour ''Reinforcement Learning'' (RL) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution. | L’apprentissage par renforcement, pour ''Reinforcement Learning'' (RL) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution. | ||
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, | Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, essaie de trouver la meilleure stratégie pour atteindre un objectif en interagissant avec l’environnement et en obtenant des « récompenses », façon de qualifier la qualité des actions prises par l’algorithme. L’apprentissage par renforcement diffère fondamentalement de l''''apprentissage supervisé''' et de l''''apprentissage non supervisé''' par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations. | ||
Voir '''apprentissage par renforcement inverse'''. | Voir '''apprentissage par renforcement inverse'''. |
Version du 14 mars 2019 à 17:13
Domaine
intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS
Définition
L’apprentissage par renforcement, pour Reinforcement Learning (RL) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, essaie de trouver la meilleure stratégie pour atteindre un objectif en interagissant avec l’environnement et en obtenant des « récompenses », façon de qualifier la qualité des actions prises par l’algorithme. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.
Voir apprentissage par renforcement inverse.
Français
apprentissage par renforcement n. m. ===
Anglais
reinforcement learning
-->
Source: Grand Dictionnaire Terminologique
Publié : datafranca.org
Contributeurs: Claude Coulombe, Jacques Barolet, wiki, Robert Meloche