« Apprentissage par fonction Q » : différence entre les versions


m (Remplacement de texte — « <small> masculin </small> » par «  »)
Aucun résumé des modifications
Ligne 2 : Ligne 2 :
Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.
Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.


Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.
== Compléments ==
La lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.


==Français==
==Français==

Version du 16 juin 2023 à 13:40

Définition

Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.

Compléments

La lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.

Français

apprentissage par fonction Q

apprentissage par fonction état-action

Anglais

Q learning


Source: Termino

Source: Claude Coulombe, Datafranca.org