Résultats de la recherche


  • ...ise ce modèle comme fonction de récompense pour améliorer la [[politique d'action|politique d'un agent]] à l'aide de l'[[apprentissage par renforcement]] gr
    3 kio (477 mots) - 5 mai 2024 à 04:01
  • ...s de la langue française, le grand Lexique s’est vu remettre par le Réseau Action TI un OCTAS dans la catégorie Français dans les TI.
    3 kio (545 mots) - 27 mai 2021 à 21:15
  • ...se fait sur la base de récompenses ou de punitions reçues en retour d’une action exécutée par un agent dans son environnement.
    4 kio (562 mots) - 29 janvier 2024 à 11:38
Voir ( | 20 suivantes) (20 | 50 | 100 | 250 | 500)