« Politique d'action » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 15 : | Ligne 15 : | ||
==Anglais== | ==Anglais== | ||
'''policy''' | '''policy''' | ||
==Sources== | ==Sources== | ||
Ligne 26 : | Ligne 25 : | ||
[[Utilisateur:Patrickdrouin | Source: Termino]] | [[Utilisateur:Patrickdrouin | Source: Termino]] | ||
[[Category:Intelligence artificielle]] | [[Category:Intelligence artificielle]] | ||
Ligne 33 : | Ligne 30 : | ||
[[Category:Termino 2019]] | [[Category:Termino 2019]] | ||
[[Category:GRAND LEXIQUE FRANÇAIS]] | [[Category:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:publication]] |
Version du 1 juillet 2024 à 20:32
Définition
En apprentissage par renforcement, processus de décision qui définit quelle action un agent doit choisir dans un contexte donné en l'absence d'un modèle de l'environnement.
Français
politique d'action
politique d'agent
politique de prise de décision
politique
stratégie
Anglais
policy
Sources
Source : Géron, Aurélien (2017) Machine Learning avec Scikit-Learn - Mise en œuvre et cas concrets, Paris, Dunod, 256 pages.
Source : Apprentissage par renforcement
Contributeurs: Claude Coulombe, Jacques Barolet, Patrick Drouin, wiki