« Reinforcement Learning with the Upper Confidence Bound » : différence entre les versions

Version du 14 avril 2019 à 21:19

Rediriger vers :

Apprentissage par renforcement avec borne de confiance supérieure

Récupérée de « https://datafranca.org/wiki/index.php?title=Reinforcement_Learning_with_the_Upper_Confidence_Bound&oldid=7974 »

Contributeurs: wiki