Fonction de récompense


Révision datée du 31 octobre 2023 à 16:12 par Claude COULOMBE (discussion | contributions) (Claude COULOMBE a déplacé la page Reward function vers Fonction de récompense)

Définition

En apprentissage par renforcement, pour une action particulière d'un agent, une fonction de récompense détermine la magnitude de la récompense ou de la pénalité qu'il reçoit en retour de cette action.

Compléments

La fonction de de récompense a généralement un impact significatif sur les résultats d'un [apprentissage par renforcement]] dont le but est de maximiser les récompenses et prédire les meilleures actions possibles dans une situation spécifique.

Français

fonction de récompense

Anglais

'reward function

Source: Dutech, Buffet, Charpillet Apprentissage par renforcement pour la conception de systèmes multi-agents réactifs, Loria 2003

Contributeurs: Claude Coulombe, wiki