« SARSA » : différence entre les versions

Version du 5 janvier 2022 à 20:47

Définition

En apprentissage par renforcement‎, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.

Français

SARSA

Anglais

SARSA

State–action–reward–state–action

Source : Wikipedia Machine Learning

Source: Acervo Lima

@@ Ligne 1 : / Ligne 1 : @@
-==en construction==
 == Définition ==
-XXXXXXXXX
+En [[apprentissage par renforcement‎]], algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme [[apprentissage par fonction Q]].
 == Français ==
-''' XXXXXXXXX '''
+'''SARSA'''
 == Anglais ==
+'''SARSA'''
 ''' State–action–reward–state–action'''
-'''SARSA'''
-State–action–reward–state–action (SARSA) is an algorithm for learning a Markov decision process policy, used in the reinforcement learning area of machine learning. It was proposed by Rummery and Niranjan in a technical note[1] with the name "Modified Connectionist Q-Learning" (MCQ-L). The alternative name SARSA, proposed by Rich Sutton, was only mentioned as a footnote.
 <small>
 [https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]
+[https://fr.acervolima.com/apprentissage-par-renforcement-sarsa/  Source: Acervo Lima]
-[[Catégorie:vocabulary]]
+[[Catégorie:publication]]
 [[Catégorie:Wikipedia-IA‎]]

« SARSA » : différence entre les versions

Version du 5 janvier 2022 à 20:47

Définition

Français

Anglais

« SARSA » : différence entre les versions