« Processus de décision markovien » : différence entre les versions


m (Pitpitt a déplacé la page Markov decision process vers Processus de décision markovien)
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(17 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Domaine ==
==Définition==
[[Category:Intelligence artificielle]]Intelligence artificielle<br>
En intelligence artificielle, un processus de décision markovien - PDM (en anglais ''Markov decision process -'' MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.
[[Catégorie:Représentation des connaissances]]Représentation des connaissances<br>
[[Catégorie:Connaissance incertaine ou stochastique]]Connaissance incertaine ou stochastique<br>
[[Catégorie:Théorie de la décision]]Théorie de la décision<br>


[[Category:Coulombe]]
Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.
[[Catégorie:Scotty]]
   
   
== Définition ==
==Français==
En intelligence artificielle, un processus de décision markovien (PDM) (en anglais ''Markov decision process'', MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.
'''processus de décision markovien   '''


Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.
'''processus de décision de Markov'''
   
   
==Anglais==
'''Markov decision process '''


== Français ==
==Sources==


'''processus de décision markovien '''


'''processus de décision de Markov'''
[https://fr.wikipedia.org/wiki/Processus_de_d%C3%A9cision_markovien Source:wikipedia]




[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=PROCESSUS+DECISIONNEL+MARKOV&index=frt&codom2nd_wet=1#resultrecs  Source : TERMIUM Plus  ]
== Anglais ==


'''Markov decision process '''


[https://fr.wikipedia.org/wiki/Processus_de_d%C3%A9cision_markovien  Source:wikipedia ]
[[Category:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 28 janvier 2024 à 11:39

Définition

En intelligence artificielle, un processus de décision markovien - PDM (en anglais Markov decision process - MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.

Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.

Français

processus de décision markovien

processus de décision de Markov

Anglais

Markov decision process


Sources

Source:wikipedia


Source : TERMIUM Plus