« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions

Version du 3 mai 2020 à 15:22

Définition

L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.

Français

Apprentissage par renforcement avec borne de confiance supérieure nom masc.

Anglais

Reinforcement Learning with the Upper Confidence Bound

Source: corpus.ulaval.ca

source : opendatascience.com

@@ Ligne 1 : / Ligne 1 : @@
-[[Catégorie:Intelligence artificielle]]
-[[Catégorie:Apprentissage automatique]]
-[[Catégorie:Apprentissage par renforcement]]Apprentissage par renforcement<br />
-[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
 ==Définition==
 L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.
@@ Ligne 19 : / Ligne 14 : @@
 [https://opendatascience.com/machine-learning-for-beginners/ source : opendatascience.com]
+[[Catégorie:Intelligence artificielle]]
+[[Catégorie:Apprentissage automatique]]
+[[Catégorie:Apprentissage par renforcement]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions

Version du 3 mai 2020 à 15:22

Définition

Français

Anglais

« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions