« Processus de décision markovien » : différence entre les versions
m (Pitpitt a déplacé la page Markov decision process vers Processus de décision markovien) |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Domaine == | ==Domaine== | ||
[[Category:Intelligence artificielle]]Intelligence artificielle<br> | [[Category:Intelligence artificielle]] | ||
[[Catégorie:Représentation des connaissances]]Représentation des connaissances<br> | Intelligence artificielle<br> | ||
[[Catégorie:Connaissance incertaine ou stochastique]]Connaissance incertaine ou stochastique<br> | [[Catégorie:Représentation des connaissances]] | ||
[[Catégorie:Théorie de la décision]]Théorie de la décision<br> | Représentation des connaissances<br> | ||
[[Catégorie:Connaissance incertaine ou stochastique]] | |||
Connaissance incertaine ou stochastique<br> | |||
[[Catégorie:Théorie de la décision]] | |||
Théorie de la décision<br> | |||
[[Category:Coulombe]] | [[Category:Coulombe]] | ||
[[Catégorie:Scotty]] | [[Catégorie:Scotty]] | ||
== Définition == | ==Définition== | ||
En intelligence artificielle, un processus de décision markovien (PDM) (en anglais ''Markov decision process'', MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent. | En intelligence artificielle, un processus de décision markovien (PDM) (en anglais ''Markov decision process'', MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent. | ||
Ligne 14 : | Ligne 18 : | ||
== Français == | ==Français >>>>>>>>>>>>redirection== | ||
'''processus de décision markovien ''' | '''processus de décision markovien '''n.m. | ||
'''processus de décision de Markov''' n.m. | |||
== Anglais == | ==Anglais== | ||
'''Markov decision process ''' | '''Markov decision process ''' | ||
[https://fr.wikipedia.org/wiki/Processus_de_d%C3%A9cision_markovien | |||
[https://fr.wikipedia.org/wiki/Processus_de_d%C3%A9cision_markovien Source:wikipedia] |
Version du 25 mai 2019 à 20:23
Domaine
Intelligence artificielle
Représentation des connaissances
Connaissance incertaine ou stochastique
Théorie de la décision
Définition
En intelligence artificielle, un processus de décision markovien (PDM) (en anglais Markov decision process, MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.
Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.
Français >>>>>>>>>>>>redirection
processus de décision markovien n.m.
processus de décision de Markov n.m.
Anglais
Markov decision process
Contributeurs: Claude Coulombe, Jacques Barolet, wiki