« SARSA » : différence entre les versions


m (Imeziani a déplacé la page State–action–reward–state–action vers SARSA)
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(2 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
XXXXXXXXX
En [[apprentissage par renforcement‎]], algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme [[apprentissage par fonction Q]].


== Français ==
== Français ==
''' XXXXXXXXX '''
'''SARSA'''


== Anglais ==
== Anglais ==
'''SARSA'''
''' State–action–reward–state–action'''
''' State–action–reward–state–action'''


'''SARSA'''
==Sources==
 
[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]


State–action–reward–state–action (SARSA) is an algorithm for learning a Markov decision process policy, used in the reinforcement learning area of machine learning. It was proposed by Rummery and Niranjan in a technical note[1] with the name "Modified Connectionist Q-Learning" (MCQ-L). The alternative name SARSA, proposed by Rich Sutton, was only mentioned as a footnote.
[https://fr.acervolima.com/apprentissage-par-renforcement-sarsa/  Source: Acervo Lima]
<small>


[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]


[[Catégorie:ENGLISH]]


[[Catégorie:vocabulary]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:Wikipedia-IA‎]]

Dernière version du 28 janvier 2024 à 12:18

Définition

En apprentissage par renforcement‎, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.

Français

SARSA

Anglais

SARSA

State–action–reward–state–action

Sources

Source : Wikipedia Machine Learning

Source: Acervo Lima

Contributeurs: Imane Meziani, wiki