« Processus de décision markovien » : différence entre les versions


m (Remplacement de texte — « <!-- Coulombe2 --> » par «  »)
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :
[[Category:Intelligence artificielle]]
[[Catégorie:Représentation des connaissances]]
[[Catégorie:Connaissance incertaine ou stochastique]]
[[Catégorie:Théorie de la décision]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
==Définition==
==Définition==
En intelligence artificielle, un processus de décision markovien - PDM (en anglais ''Markov decision process -'' MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.  
En intelligence artificielle, un processus de décision markovien - PDM (en anglais ''Markov decision process -'' MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.  
Ligne 29 : Ligne 20 :


[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=PROCESSUS+DECISIONNEL+MARKOV&index=frt&codom2nd_wet=1#resultrecs  Source : TERMIUM Plus  ]
[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=PROCESSUS+DECISIONNEL+MARKOV&index=frt&codom2nd_wet=1#resultrecs  Source : TERMIUM Plus  ]
[[Category:Intelligence artificielle]]
[[Catégorie:Représentation des connaissances]]
[[Catégorie:Connaissance incertaine ou stochastique]]
[[Catégorie:Théorie de la décision]]
[[Category:GRAND LEXIQUE FRANÇAIS]]

Version du 8 mai 2020 à 09:37

Définition

En intelligence artificielle, un processus de décision markovien - PDM (en anglais Markov decision process - MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.

Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.

Français

processus de décision markovien nom masc.

processus de décision de Markov nom masc.

Anglais

Markov decision process



Source:wikipedia


Source : TERMIUM Plus