« Apprentissage par fonction Q » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
m (Remplacement de texte — « <small> masculin </small> » par «  »)
Ligne 5 : Ligne 5 :


==Français==
==Français==
'''apprentissage par fonction Q  '''   <small> masculin </small>
'''apprentissage par fonction Q  '''  


'''apprentissage par fonction état-action'''  <small> masculin </small>
'''apprentissage par fonction état-action'''   


==Anglais==
==Anglais==

Version du 1 février 2021 à 19:18

Définition

Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.

Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.

Français

apprentissage par fonction Q

apprentissage par fonction état-action

Anglais

Q learning


Source: Termino

Source: Claude Coulombe, Datafranca.org