« Apprentissage par renforcement inverse » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(26 versions intermédiaires par 5 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Domaine ==
==Définition==
[[category:Vocabulaire2]]<br />
L'apprentissage par renforcement inverse (''Inverse Reinforcement Learning'' ) consiste à dériver une '''[[fonction de récompense]]''' du comportement observé. Bien que l'apprentissage par renforcement ordinaire implique l'utilisation de récompenses et de punitions pour apprendre un comportement, en IRL la direction est inversée et un robot observe le comportement d'une personne pour déterminer l'objectif que ce comportement semble viser. Le problème IRL peut être défini comme suit:
[[category:scotty2]]<br />
[[Category:GRAND LEXIQUE FRANÇAIS]]


== Définition ==
Étant donné 
L'apprentissage par renforcement inverse, de ''Inverse Reinforcement Learning'' (IRL) consiste à dériver une fonction de récompense du comportement observé. Bien que l'apprentissage par renforcement ordinaire implique l'utilisation de récompenses et de punitions pour apprendre un comportement, en IRL la direction est inversée et un robot observe le comportement d'une personne pour déterminer l'objectif que ce comportement semble viser. Le problème IRL peut être défini comme suit:
* la mesure du comportement d'un agent dans le temps, dans diverses circonstances;
* mesures des entrées sensorielles de cet agent;
* un modèle de l'environnement physique (y compris le corps de l'agent): déterminez la fonction de récompense optimisée par l'agent.


Étant donné 1) la mesure du comportement d'un agent dans le temps, dans diverses circonstances; 2) mesures des entrées sensorielles de cet agent; 3) un modèle de l'environnement physique (y compris le corps de l'agent): déterminez la fonction de récompense optimisée par l'agent.<br />
Voir '''[[apprentissage par renforcement]]'''


Voir [[apprentissage par renforcement]]
==Français==
'''apprentissage par renforcement inverse''' 


'''apprentissage par imitation''' 


== Français ==
==Anglais==
'''apprentissage par renforcement inverse'''   n.m.
'''inverse reinforcement learning'''


'''apprentissage par imitation'''   n.f.
'''IRL'''
==Sources==
[https://en.wikipedia.org/wiki/Apprenticeship_learning  Source : Wikipedia]


== Anglais ==
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
 
'''Inverse Reinforcement Learning (IRL)'''
 
 
 
 
[https://en.wikipedia.org/wiki/Apprenticeship_learning    ''Source: Wikipedia'' ]

Dernière version du 30 août 2024 à 13:57

Définition

L'apprentissage par renforcement inverse (Inverse Reinforcement Learning ) consiste à dériver une fonction de récompense du comportement observé. Bien que l'apprentissage par renforcement ordinaire implique l'utilisation de récompenses et de punitions pour apprendre un comportement, en IRL la direction est inversée et un robot observe le comportement d'une personne pour déterminer l'objectif que ce comportement semble viser. Le problème IRL peut être défini comme suit:

Étant donné

  • la mesure du comportement d'un agent dans le temps, dans diverses circonstances;
  • mesures des entrées sensorielles de cet agent;
  • un modèle de l'environnement physique (y compris le corps de l'agent): déterminez la fonction de récompense optimisée par l'agent.

Voir apprentissage par renforcement

Français

apprentissage par renforcement inverse

apprentissage par imitation

Anglais

inverse reinforcement learning

IRL

Sources

Source : Wikipedia