Apprentissage par renforcement avec borne de confiance supérieure : Différence entre versions


De DataFranca
Balise : éditeur de source 2017
Balise : éditeur de source 2017
Ligne 1 : Ligne 1 :
 
==Domaine==
 
==Domaine==
[[Category:Vocabulaire]]
+
[[Category:Vocabulaire2]]
 
[[Category:Intelligence artificielle]]
 
[[Category:Intelligence artificielle]]
 
[[Catégorie:Apprentissage automatique]]
 
[[Catégorie:Apprentissage automatique]]

Version du 25 mai 2019 à 15:44

Domaine


Définition

L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.


Français

Apprentissage par renforcement avec borne de confiance supérieure n.m.


Anglais

Reinforcement Learning with the Upper Confidence Bound


Source: corpus.ulaval.ca

source : opendatascience.com

Contributeurs : Claude Coulombe, Gérard Pelletier, Jacques Barolet, admin

Vous devez demander un compte pour contribuer à cette page.