« SARSA » : différence entre les versions


m (Imeziani a déplacé la page State–action–reward–state–action vers SARSA)
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
XXXXXXXXX
En [[apprentissage par renforcement‎]], algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme [[apprentissage par fonction Q]].


== Français ==
== Français ==
''' XXXXXXXXX '''
'''SARSA'''


== Anglais ==
== Anglais ==
'''SARSA'''
''' State–action–reward–state–action'''
''' State–action–reward–state–action'''


'''SARSA'''
State–action–reward–state–action (SARSA) is an algorithm for learning a Markov decision process policy, used in the reinforcement learning area of machine learning. It was proposed by Rummery and Niranjan in a technical note[1] with the name "Modified Connectionist Q-Learning" (MCQ-L). The alternative name SARSA, proposed by Rich Sutton, was only mentioned as a footnote.
<small>
<small>


[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]
[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]
[https://fr.acervolima.com/apprentissage-par-renforcement-sarsa/  Source: Acervo Lima]




[[Catégorie:vocabulary]]
[[Catégorie:publication]]
[[Catégorie:Wikipedia-IA‎]]
[[Catégorie:Wikipedia-IA‎]]

Version du 5 janvier 2022 à 19:47

Définition

En apprentissage par renforcement‎, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.

Français

SARSA

Anglais

SARSA

State–action–reward–state–action

Source : Wikipedia Machine Learning

Source: Acervo Lima

Contributeurs: Imane Meziani, wiki