Résultats de la recherche
- ...ise ce modèle comme fonction de récompense pour améliorer la [[politique d'action|politique d'un agent]] à l'aide de l'[[apprentissage par renforcement]] gr3 kio (477 mots) - 5 mai 2024 à 04:01
- ...s de la langue française, le grand Lexique s’est vu remettre par le Réseau Action TI un OCTAS dans la catégorie Français dans les TI.3 kio (545 mots) - 27 mai 2021 à 21:15
- ...se fait sur la base de récompenses ou de punitions reçues en retour d’une action exécutée par un agent dans son environnement.4 kio (562 mots) - 29 janvier 2024 à 11:38