« Processus de décision markovien » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Ligne 14 : Ligne 14 :
   
   
==Définition==
==Définition==
En intelligence artificielle, un processus de décision markovien (PDM) (en anglais ''Markov decision process'', MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.  
En intelligence artificielle, un processus de décision markovien - PDM (en anglais ''Markov decision process -'' MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.  


Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.
Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.

Version du 27 mai 2019 à 16:19

Domaine

Intelligence artificielle
Représentation des connaissances
Connaissance incertaine ou stochastique
Théorie de la décision

Définition

En intelligence artificielle, un processus de décision markovien - PDM (en anglais Markov decision process - MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.

Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.


Français >>>>>>>>>>>>redirection

processus de décision markovien n.m.

processus de décision de Markov n.m.


Anglais

Markov decision process


Source:wikipedia