« Apprentissage par fonction Q » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
m (Remplacement de texte — « [[Category: » par « [[Catégorie: »)
Ligne 1 : Ligne 1 :
<!-- Vocabulary2 -->
<!-- Vocabulary2 -->
<!-- Vocabulaire -->
<!-- Vocabulaire -->
[[Category:Intelligence artificielle]]
[[Catégorie:Intelligence artificielle]]
[[Category:Termino 2019]]
[[Catégorie:Termino 2019]]
<!-- Scotty2 -->
<!-- Scotty2 -->
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]


==Définition==
==Définition==

Version du 27 septembre 2019 à 10:00


Définition

Algorithme d'apprentissage par renforcement sans modèle ayant pour but d'apprendre une stratégie qui guidera un agent dans les décisions à prendre dans une situation donnée.

Note: la lettre Q désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.

Français

apprentissage par fonction Q loc. nom. masc

apprentissage par fonction état-action loc. nom. masc.

Anglais

Q learning


Source: Termino

Source: Claude Coulombe, Datafranca.org