« Apprentissage par renforcement inverse » : différence entre les versions
m (Remplacement de texte — « ==Définition== » par « ==Définition== ») |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
L'apprentissage par renforcement inverse (''Inverse Reinforcement Learning'' ) consiste à dériver une fonction de récompense du comportement observé. Bien que l'apprentissage par renforcement ordinaire implique l'utilisation de récompenses et de punitions pour apprendre un comportement, en IRL la direction est inversée et un robot observe le comportement d'une personne pour déterminer l'objectif que ce comportement semble viser. Le problème IRL peut être défini comme suit: | L'apprentissage par renforcement inverse (''Inverse Reinforcement Learning'' ) consiste à dériver une fonction de récompense du comportement observé. Bien que l'apprentissage par renforcement ordinaire implique l'utilisation de récompenses et de punitions pour apprendre un comportement, en IRL la direction est inversée et un robot observe le comportement d'une personne pour déterminer l'objectif que ce comportement semble viser. Le problème IRL peut être défini comme suit: | ||
Étant donné | Étant donné | ||
* la mesure du comportement d'un agent dans le temps, dans diverses circonstances; | |||
* mesures des entrées sensorielles de cet agent; | |||
* un modèle de l'environnement physique (y compris le corps de l'agent): déterminez la fonction de récompense optimisée par l'agent. | |||
Voir '''[[apprentissage par renforcement]]''' | Voir '''[[apprentissage par renforcement]]''' | ||
Ligne 23 : | Ligne 17 : | ||
'''Inverse Reinforcement Learning (IRL)''' | '''Inverse Reinforcement Learning (IRL)''' | ||
Ligne 29 : | Ligne 22 : | ||
[https://en.wikipedia.org/wiki/Apprenticeship_learning ''Source: Wikipedia''] | [https://en.wikipedia.org/wiki/Apprenticeship_learning ''Source: Wikipedia''] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Version du 3 mai 2020 à 14:24
Définition
L'apprentissage par renforcement inverse (Inverse Reinforcement Learning ) consiste à dériver une fonction de récompense du comportement observé. Bien que l'apprentissage par renforcement ordinaire implique l'utilisation de récompenses et de punitions pour apprendre un comportement, en IRL la direction est inversée et un robot observe le comportement d'une personne pour déterminer l'objectif que ce comportement semble viser. Le problème IRL peut être défini comme suit:
Étant donné
- la mesure du comportement d'un agent dans le temps, dans diverses circonstances;
- mesures des entrées sensorielles de cet agent;
- un modèle de l'environnement physique (y compris le corps de l'agent): déterminez la fonction de récompense optimisée par l'agent.
Voir apprentissage par renforcement
Français
apprentissage par renforcement inverse loc. nom. masc.
apprentissage par imitation loc. nom. masc.
Anglais
Inverse Reinforcement Learning (IRL)
Contributeurs: Evan Brach, Claire Gorjux, Claude Coulombe, Jacques Barolet, wiki