« SARSA » : différence entre les versions

Dernière version du 28 janvier 2024 à 13:18

Définition

En apprentissage par renforcement‎, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.

Français

SARSA

Anglais

SARSA

State–action–reward–state–action

Sources

Source : Wikipedia Machine Learning

Source: Acervo Lima

@@ Ligne 1 : / Ligne 1 : @@
-==en construction==
 == Définition ==
-XXXXXXXXX
+En [[apprentissage par renforcement‎]], algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme [[apprentissage par fonction Q]].
 == Français ==
-''' XXXXXXXXX '''
+'''SARSA'''
 == Anglais ==
+'''SARSA'''
 ''' State–action–reward–state–action'''
-'''SARSA'''
+==Sources==
+[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]
-State–action–reward–state–action (SARSA) is an algorithm for learning a Markov decision process policy, used in the reinforcement learning area of machine learning. It was proposed by Rummery and Niranjan in a technical note[1] with the name "Modified Connectionist Q-Learning" (MCQ-L). The alternative name SARSA, proposed by Rich Sutton, was only mentioned as a footnote.
+[https://fr.acervolima.com/apprentissage-par-renforcement-sarsa/  Source: Acervo Lima]
-<small>
-[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]
+[[Catégorie:ENGLISH]]
-[[Catégorie:vocabulary]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
-[[Catégorie:Wikipedia-IA‎]]