« Apprentissage par fonction Q » : différence entre les versions
m (Remplacement de texte — « [[Category: » par « [[Catégorie: ») |
m (Remplacement de texte — « ==Définition== » par « ==Définition== ») |
||
Ligne 5 : | Ligne 5 : | ||
<!-- Scotty2 --> | <!-- Scotty2 --> | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
==Définition== | ==Définition== | ||
Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée. | Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée. |
Version du 18 avril 2020 à 08:31
Définition
Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.
Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.
Français
apprentissage par fonction Q loc. nom. masc
apprentissage par fonction état-action loc. nom. masc.
Anglais
Q learning
Contributeurs: Claude Coulombe, Jacques Barolet, Julie Roy, Patrick Drouin, wiki