« Politique d'action » : différence entre les versions


m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
Aucun résumé des modifications
(Une version intermédiaire par le même utilisateur non affichée)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Processus de décision qui définit quelle action un agent doit choisir dans un contexte donné en apprentissage par renforcement en l'absence d'un modèle de l'environnement.  
En apprentissage par renforcement, processus de décision qui définit quelle action un agent doit choisir dans un contexte donné en l'absence d'un modèle de l'environnement.  


==Français==
==Français==
Ligne 15 : Ligne 15 :
==Anglais==
==Anglais==
'''policy'''
'''policy'''


==Sources==
==Sources==
Ligne 26 : Ligne 25 :


[[Utilisateur:Patrickdrouin  | Source: Termino]]
[[Utilisateur:Patrickdrouin  | Source: Termino]]


[[Category:Intelligence artificielle]]
[[Category:Intelligence artificielle]]
Ligne 33 : Ligne 30 :
[[Category:Termino 2019]]
[[Category:Termino 2019]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:publication]]

Version du 1 juillet 2024 à 21:32

Définition

En apprentissage par renforcement, processus de décision qui définit quelle action un agent doit choisir dans un contexte donné en l'absence d'un modèle de l'environnement.

Français

politique d'action

politique d'agent

politique de prise de décision

politique

stratégie

Anglais

policy

Sources

Source : Géron, Aurélien (2017) Machine Learning avec Scikit-Learn - Mise en œuvre et cas concrets, Paris, Dunod, 256 pages.

Source : Apprentissage par renforcement

Source: Claude Coulombe, Datafranca.org

Source: Termino