« Apprentissage par fonction Q » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 12 : Ligne 12 :


==Français==
==Français==
'''apprentissage par fonction Q  ''' loc. nom. masc
'''apprentissage par fonction Q  ''' <small>loc. nom. masc</small>
 
'''apprentissage par fonction état-action'''  loc. nom. masc


'''apprentissage par fonction état-action'''  <small>loc. nom. masc.
</small>
==Anglais==
==Anglais==



Version du 9 juillet 2019 à 23:38


Définition

Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.

Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.

Français

apprentissage par fonction Q loc. nom. masc

apprentissage par fonction état-action loc. nom. masc.

Anglais

Q learning


Source: Termino

Source: Claude Coulombe, Datafranca.org