« SARSA » : différence entre les versions
m (Imeziani a déplacé la page State–action–reward–state–action vers SARSA) |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
En [[apprentissage par renforcement]], algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme [[apprentissage par fonction Q]]. | |||
== Français == | == Français == | ||
''' | '''SARSA''' | ||
== Anglais == | == Anglais == | ||
'''SARSA''' | |||
''' State–action–reward–state–action''' | ''' State–action–reward–state–action''' | ||
<small> | <small> | ||
[https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action Source : Wikipedia Machine Learning ] | [https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action Source : Wikipedia Machine Learning ] | ||
[https://fr.acervolima.com/apprentissage-par-renforcement-sarsa/ Source: Acervo Lima] | |||
[[Catégorie: | [[Catégorie:publication]] | ||
[[Catégorie:Wikipedia-IA]] | [[Catégorie:Wikipedia-IA]] |
Version du 5 janvier 2022 à 19:47
Définition
En apprentissage par renforcement, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.
Français
SARSA
Anglais
SARSA
State–action–reward–state–action
Contributeurs: Imane Meziani, wiki