« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions

Version du 24 juin 2019 à 08:29

Apprentissage par renforcement

Définition

L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.

Français

Apprentissage par renforcement avec borne de confiance supérieure n.m.

Anglais

Reinforcement Learning with the Upper Confidence Bound

Source: corpus.ulaval.ca

source : opendatascience.com

@@ Ligne 1 : / Ligne 1 : @@
-==Domaine==
-[[Category:Vocabulaire2]]
+[[Category:Intelligence artificielle]]
-[[Category:Intelligence artificielle]]Intelligence artificielle<br />
+[[Catégorie:Apprentissage automatique]]
-[[Catégorie:Apprentissage automatique]]Apprentissage automatique<br />
 [[Catégorie:Apprentissage par renforcement]]Apprentissage par renforcement<br />
-[[Category:Coulombe2]]
 [[Category:GRAND LEXIQUE FRANÇAIS]]
-[[Catégorie:Scotty2]]
 ==Définition==
@@ Ligne 18 : / Ligne 15 : @@
+<small>
 [https://corpus.ulaval.ca/jspui/bitstream/20.500.11794/28250/1/33992.pdf Source: corpus.ulaval.ca]
 [https://opendatascience.com/machine-learning-for-beginners/ source : opendatascience.com]

« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions

Version du 24 juin 2019 à 08:29

Définition

Français

Anglais

« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions