« Apprentissage par renforcement » : différence entre les versions


Ligne 7 : Ligne 7 :


== Définition ==
== Définition ==
En apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement, et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative. L'agent cherche, au travers d'expériences itérées, un comportement décisionnel (appelé stratégie ou politique, et qui est une fonction associant à l'état courant l'action à exécuter) optimal, en ce sens qu'il maximise la somme des récompenses au cours du temps.
L’apprentissage par renforcement, pour ''Reinforcement Learning'' (RL) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.
 
Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l''''apprentissage supervisé''' et de l''''apprentissage non supervisé''' par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.


L’apprentissage par renforcement diffère fondamentalement de l''''apprentissage supervisé''' et de l''''apprentissage non supervisé''' par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.<br />
Voir '''apprentissage par renforcement inverse'''.
Voir '''apprentissage par renforcement inverse'''.
<br />
<br />

Version du 14 mars 2019 à 17:24

Domaine

intelligence artificielle
GDT
GRAND LEXIQUE FRANÇAIS


Définition

L’apprentissage par renforcement, pour Reinforcement Learning (RL) fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences successives, ce qu’il convient de faire de façon à trouver la meilleure solution.

Dans un tel apprentissage, on dit qu’un « agent », l’algorithme, interagit avec « l’environnement » pour trouver la solution optimale. L’apprentissage par renforcement diffère fondamentalement de l'apprentissage supervisé et de l'apprentissage non supervisé par ce côté interactif et itératif: l’agent essaie plusieurs solutions, on parle « d’exploration », observe la réaction de l’environnement et adapte son comportement (les variables) pour trouver la meilleure stratégie. On dira qu'il « exploite » le résultat de ses explorations.

Voir apprentissage par renforcement inverse.

Français

apprentissage par renforcement n. m. ===

Anglais

reinforcement learning

--> Source: Grand Dictionnaire Terminologique

Publié : datafranca.org