« Apprentissage par renforcement avec borne de confiance supérieure » : historique des versions


Sélection du diff : cochez les boutons radio des versions à comparer et appuyez sur entrée ou sur le bouton en bas.
Légende : (actu) = différence avec la dernière version, (diff) = différence avec la version précédente, m = modification mineure.

11 février 2024

29 janvier 2024

27 janvier 2024

7 avril 2021

4 février 2021

30 janvier 2021

9 décembre 2020

3 mai 2020

18 avril 2020

16 avril 2020

27 septembre 2019

24 juin 2019

15 juin 2019

13 juin 2019

25 mai 2019

15 avril 2019

14 avril 2019

9 mars 2019

8 mars 2019

  • actudiff 06:498 mars 2019 à 06:49Gdpelletier discussion contributions 445 octets +445 Page créée avec « Recall the general setup for reinforcement learning: we have well-defined actions that we can take, so we let the machine figure out how to maximize its reward based on th... »