Apprentissage par fonction Q


Révision datée du 1 février 2021 à 18:18 par Pitpitt (discussion | contributions) (Remplacement de texte — « <small> masculin </small> » par «  »)

Définition

Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.

Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.

Français

apprentissage par fonction Q

apprentissage par fonction état-action

Anglais

Q learning


Source: Termino

Source: Claude Coulombe, Datafranca.org