« Apprentissage par renforcement avec borne de confiance supérieure » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
(11 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Domaine ==
==Définition==
[[Category:Vocabulary]]<br/>
L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.
[[Category:Intelligence artificielle]]Intelligence artificielle<br/>
 
[[Catégorie:Apprentissage automatique]] Apprentissage automatique<br/>
==Français==
[[Catégorie:Apprentissage par renforcement]] Apprentissage par renforcement<br/>
'''Apprentissage par renforcement avec borne de confiance supérieure'''  nom masc.
[[Category:Coulombe]]Coulombe<br/>
 
[[Catégorie:Scotty]]<br/>
==Anglais==
'''Reinforcement Learning with the Upper Confidence Bound'''


== Définition ==
L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.


<br />
<small>
== Français ==
'''Apprentissage par renforcement avec borne de confiance supérieure'''


<br />
[https://corpus.ulaval.ca/jspui/bitstream/20.500.11794/28250/1/33992.pdf Source: corpus.ulaval.ca]


== Anglais ==
[https://opendatascience.com/machine-learning-for-beginners/ source : opendatascience.com]
'''Reinforcement Learning with the Upper Confidence Bound'''


<br />


[https://corpus.ulaval.ca/jspui/bitstream/20.500.11794/28250/1/33992.pdf    Source: corpus.ulaval.ca ]


[https://opendatascience.com/machine-learning-for-beginners/  source : opendatascience.com ]
[[Catégorie:Intelligence artificielle]]
[[Catégorie:Apprentissage automatique]]
[[Catégorie:Apprentissage par renforcement]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Version du 3 mai 2020 à 15:22

Définition

L'algorithme d'apprentissage par renforcement avec borne de confiance supérieure est basé sur le principe d'optimisme face à l’incertitude qui consiste à utiliser une borne supérieure sur l’espérance des récompenses pour chaque action.

Français

Apprentissage par renforcement avec borne de confiance supérieure nom masc.

Anglais

Reinforcement Learning with the Upper Confidence Bound


Source: corpus.ulaval.ca

source : opendatascience.com