Apprentissage par renforcement avec borne de confiance supérieure


De DataFranca

Domaine

Intelligence artificielle
Apprentissage automatique
Apprentissage par renforcement


Définition

L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.

Français

Apprentissage par renforcement avec borne de confiance supérieure n.m.


Anglais

Reinforcement Learning with the Upper Confidence Bound


Source: corpus.ulaval.ca

source : opendatascience.com

Contributeurs : Claude Coulombe, Gérard Pelletier, Jacques Barolet, admin

Vous devez demander un compte pour contribuer à cette page.