« Processus de décision markovien » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
(10 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
En intelligence artificielle, un processus de décision markovien - PDM (en anglais ''Markov decision process -'' MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent. | En intelligence artificielle, un processus de décision markovien - PDM (en anglais ''Markov decision process -'' MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent. | ||
Ligne 14 : | Ligne 5 : | ||
==Français== | ==Français== | ||
'''processus de décision markovien ''' | '''processus de décision markovien ''' | ||
'''processus de décision de Markov''' | '''processus de décision de Markov''' | ||
==Anglais== | ==Anglais== | ||
Ligne 22 : | Ligne 13 : | ||
==Sources== | |||
Ligne 29 : | Ligne 20 : | ||
[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=PROCESSUS+DECISIONNEL+MARKOV&index=frt&codom2nd_wet=1#resultrecs Source : TERMIUM Plus ] | [https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=PROCESSUS+DECISIONNEL+MARKOV&index=frt&codom2nd_wet=1#resultrecs Source : TERMIUM Plus ] | ||
[[Category:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 28 janvier 2024 à 11:39
Définition
En intelligence artificielle, un processus de décision markovien - PDM (en anglais Markov decision process - MDP) est un modèle aléatoire où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les PDM sont une extension des chaînes de Markov avec plusieurs actions à choisir par état et où des récompenses sont gagnées par l'agent.
Les PDM sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement dans de nombreuses disciplines, notamment la robotique, l'automatisation, l'économie et l'industrie manufacturière.
Français
processus de décision markovien
processus de décision de Markov
Anglais
Markov decision process
Sources
Contributeurs: Claude Coulombe, Jacques Barolet, wiki