« SARSA » : différence entre les versions

Dernière version du 28 janvier 2024 à 13:18

Définition

En apprentissage par renforcement‎, algorithme d'apprentissage dont l’acronyme anglais correspond à State-Action-Reward-State-Action, en français: État-Action-Récompense-État-Action. Il s'agit d'une légère variation du populaire algorithme apprentissage par fonction Q.

Français

SARSA

Anglais

SARSA

State–action–reward–state–action

Sources

Source : Wikipedia Machine Learning

Source: Acervo Lima

@@ Ligne 10 : / Ligne 10 : @@
 ''' State–action–reward–state–action'''
-<small>
+==Sources==
 [https://en.wikipedia.org/wiki/State%E2%80%93action%E2%80%93reward%E2%80%93state%E2%80%93action  Source : Wikipedia  Machine Learning ]

« SARSA » : différence entre les versions