« Apprentissage par fonction Q » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
m (Remplacement de texte — « <small>loc. nom. masc.</small> » par « <small> masculin </small> »)
Ligne 7 : Ligne 7 :
'''apprentissage par fonction Q  ''' <small>loc. nom. masc</small>
'''apprentissage par fonction Q  ''' <small>loc. nom. masc</small>


'''apprentissage par fonction état-action'''  <small>loc. nom. masc.</small>
'''apprentissage par fonction état-action'''  <small> masculin </small>


==Anglais==
==Anglais==

Version du 22 mai 2020 à 22:50

Définition

Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.

Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.

Français

apprentissage par fonction Q loc. nom. masc

apprentissage par fonction état-action masculin

Anglais

Q learning


Source: Termino

Source: Claude Coulombe, Datafranca.org