« Fonction de récompense » : différence entre les versions


m (Claude COULOMBE a déplacé la page Reward function vers Fonction de récompense)
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(6 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
En [[apprentissage par renforcement]], pour une action particulière d'un [[agent]], une fonction de récompense détermine la magnitude de la récompense ou de la pénalité qu'il reçoit en retour de cette action.  
En [[apprentissage par renforcement]], pour une action particulière d'un [[agent]], une fonction de récompense détermine la magnitude de la récompense ou de la pénalité qu'il reçoit en retour de cette action.  
En [[recherche heuristique]], une fonction de récompense peut être définie comme l'évaluation d'un état particulier. Par exemple, l'évaluation du résultat d'un coup aux échecs.


== Compléments ==
== Compléments ==
La fonction de de récompense a généralement un impact significatif sur les résultats d'un [apprentissage par renforcement]] dont le but est de maximiser les récompenses et prédire les meilleures actions possibles dans une situation spécifique.  
La fonction de de récompense a généralement un impact significatif sur les résultats d'un [[apprentissage par renforcement]] dont le but est de maximiser les récompenses et prédire les meilleures actions possibles dans une situation spécifique.  


==Français==
==Français==
Ligne 11 : Ligne 13 :
==Anglais==
==Anglais==


'''reward function''
'''reward function'''


<small>
 
==Sources==


[https://members.loria.fr/OBuffet/papiers/jfsma03.pdf Source:  Dutech, Buffet, Charpillet '' Apprentissage par renforcement pour la conception de systèmes multi-agents réactifs'',  Loria 2003]
[https://members.loria.fr/OBuffet/papiers/jfsma03.pdf Source:  Dutech, Buffet, Charpillet '' Apprentissage par renforcement pour la conception de systèmes multi-agents réactifs'',  Loria 2003]
[https://en.wikipedia.org/wiki/Reinforcement_learning Source: ''Reinforcement learning'', Wikipedia]


[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:Publication]]

Dernière version du 27 janvier 2024 à 21:45

Définition

En apprentissage par renforcement, pour une action particulière d'un agent, une fonction de récompense détermine la magnitude de la récompense ou de la pénalité qu'il reçoit en retour de cette action.

En recherche heuristique, une fonction de récompense peut être définie comme l'évaluation d'un état particulier. Par exemple, l'évaluation du résultat d'un coup aux échecs.

Compléments

La fonction de de récompense a généralement un impact significatif sur les résultats d'un apprentissage par renforcement dont le but est de maximiser les récompenses et prédire les meilleures actions possibles dans une situation spécifique.

Français

fonction de récompense

Anglais

reward function


Sources

Source: Dutech, Buffet, Charpillet Apprentissage par renforcement pour la conception de systèmes multi-agents réactifs, Loria 2003

Source: Reinforcement learning, Wikipedia

Contributeurs: Claude Coulombe, wiki