« Politique d'action » : différence entre les versions

Version du 1 juillet 2024 à 23:17

Définition

En apprentissage par renforcement, processus de décision qui définit quelle action un agent doit choisir dans un contexte ou un état donné.

En général, une politique d'action n'apprend pas explicitement un modèle de l'environnement, ce qui en fait une méthode d'apprentissage par renforcement sans modèle.

Compléments

Un algorithme d'apprentissage par renforcement apprend une Politique: État => 𝐴ction, c'est-à-dire une fonction Politique qui à chaque État préconise une Action à exécuter qui maximise les récompenses.

Une politique peut aussi être probabiliste: Politique(Action,État) = Probabilité(Action_t = Action| État_t = État) qui est la probabilité que l'agent choisisse d'exécuter Action alores qu'il est dans l'État.

Français

politique d'action

politique d'agent

politique de prise de décision

politique

stratégie d'action

stratégie d'agent

stratégie

Anglais

policy

Sources

Source : Géron, Aurélien (2017) Machine Learning avec Scikit-Learn - Mise en œuvre et cas concrets, Paris, Dunod, 256 pages.

Source : Apprentissage par renforcement

Source: Claude Coulombe, Datafranca.org

Source: Termino

@@ Ligne 1 : / Ligne 1 : @@
-[[Category:Vocabulary2]]
+==Définition==
-[[Category:Vocabulaire2]]
+En apprentissage par renforcement, processus de décision qui définit quelle action un agent doit choisir dans un contexte ou un état donné.
-[[Category:Intelligence artificielle]]
-[[Category:Apprentissage profond]]
+En général, une politique d'action n'apprend pas explicitement un modèle de l'environnement, ce qui en fait une méthode d'apprentissage par renforcement sans modèle.
-[[Category:Termino 2019]]
-[[Category:Scotty]]
+==Compléments==
+Un algorithme d'apprentissage par renforcement apprend une Politique: État => 𝐴ction, c'est-à-dire une fonction Politique qui à chaque État préconise une Action à exécuter qui maximise les récompenses.
-==Définition==
+Une politique peut aussi être probabiliste: Politique(Action,État) = Probabilité(Action_t = Action| État_t = État) qui est la probabilité que l'agent choisisse d'exécuter Action alores qu'il est dans l'État.
-Processus de décision qui définit quelle action un agent doit choisir dans un contexte donné en apprentissage par renforcement.
 ==Français==
-'''politique'''  n.f.
+'''politique d'action'''
+'''politique d'agent'''
-'''stratégie'''  n.f.
+'''politique de prise de décision'''
+'''politique'''
+'''stratégie d'action'''
+'''stratégie d'agent'''
+'''stratégie'''
 ==Anglais==
 '''policy'''
+==Sources==
+Source : Géron, Aurélien (2017) ''Machine Learning avec Scikit-Learn - Mise en œuvre et cas concrets'', Paris, Dunod, 256 pages.
+[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement#Politique  Source : Apprentissage par renforcement]
-<small>
+[[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]
-Source : Géron, Aurélien (2017) Machine Learning avec Scikit-Learn - Mise en oeuvre et cas concrets, Paris, Dunod, 256 pages.
+[[Utilisateur:Patrickdrouin  | Source: Termino]]
-[[Utilisateur:Claude COULOMBE | source : Claude Coulombe, Datafranca.org]]
+[[Category:Intelligence artificielle]]
+[[Category:Apprentissage profond]]
+[[Category:Termino 2019]]
+[[Category:GRAND LEXIQUE FRANÇAIS]]
+[[Catégorie:publication]]