« SARSA » : différence entre les versions
m (Imeziani a déplacé la page State–action–reward–state–action vers SARSA) |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
(2 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
En [[apprentissage par renforcement]], algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme [[apprentissage par fonction Q]]. | |||
== Français == | == Français == | ||
''' | '''SARSA''' | ||
== Anglais == | == Anglais == | ||
'''SARSA''' | |||
''' State–action–reward–state–action''' | ''' State–action–reward–state–action''' | ||
==Sources== | |||
[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action Source : Wikipedia Machine Learning ] | |||
[https://fr.acervolima.com/apprentissage-par-renforcement-sarsa/ Source: Acervo Lima] | |||
[[Catégorie:ENGLISH]] | |||
[[Catégorie: | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
Dernière version du 28 janvier 2024 à 12:18
Définition
En apprentissage par renforcement, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.
Français
SARSA
Anglais
SARSA
State–action–reward–state–action
Sources
Contributeurs: Imane Meziani, wiki