« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions


m (Remplacement de texte — « [[Category: » par « [[Catégorie: »)
m (Remplacement de texte — « n.m. » par « nom masc. »)
Ligne 9 : Ligne 9 :


==Français==
==Français==
'''Apprentissage par renforcement avec borne de confiance supérieure'''  n.m.
'''Apprentissage par renforcement avec borne de confiance supérieure'''  nom masc.


==Anglais==
==Anglais==

Version du 16 avril 2020 à 10:42

Apprentissage par renforcement

Définition

L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.

Français

Apprentissage par renforcement avec borne de confiance supérieure nom masc.

Anglais

Reinforcement Learning with the Upper Confidence Bound


Source: corpus.ulaval.ca

source : opendatascience.com