« Modèle de la valeur primaire apprise » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
(2 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Le modèle de la valeur primaire apprise (PVLV) est une explication possible des propriétés de déclenchement prédictif de la récompense des neurones dopaminergiques (DA). Il simule les données comportementales et neuronales sur le conditionnement pavlovien et les neurones dopaminergiques du mésencéphale qui se déclenchent proportionnellement aux récompenses inattendues. | Le modèle de la valeur primaire apprise (PVLV) est une explication possible des propriétés de déclenchement prédictif de la récompense des neurones dopaminergiques (DA). | ||
Il simule les [[donnée|données]] comportementales et neuronales sur le conditionnement pavlovien et les neurones dopaminergiques du mésencéphale qui se déclenchent proportionnellement aux récompenses inattendues. | |||
Il s'agit d'une alternative à l'algorithme des différences temporelles (TD). | Il s'agit d'une alternative à l'algorithme des différences temporelles (TD). | ||
Ligne 8 : | Ligne 10 : | ||
== Anglais == | == Anglais == | ||
''' primary value learned value''' | '''primary value learned value''' | ||
'''PVLV''' | '''PVLV''' | ||
==Sources== | |||
[https://en.wikipedia.org/wiki/PVLV Source : Source : Wikipedia ] | [https://en.wikipedia.org/wiki/PVLV Source : Source : Wikipedia ] | ||
Ligne 18 : | Ligne 21 : | ||
[https://en.wikipedia.org/wiki/Outline_of_machine_learning#Machine_learning_algorithms Source : Wikipedia Machine learning algorithms ] | [https://en.wikipedia.org/wiki/Outline_of_machine_learning#Machine_learning_algorithms Source : Wikipedia Machine learning algorithms ] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 28 janvier 2024 à 09:56
Définition
Le modèle de la valeur primaire apprise (PVLV) est une explication possible des propriétés de déclenchement prédictif de la récompense des neurones dopaminergiques (DA).
Il simule les données comportementales et neuronales sur le conditionnement pavlovien et les neurones dopaminergiques du mésencéphale qui se déclenchent proportionnellement aux récompenses inattendues.
Il s'agit d'une alternative à l'algorithme des différences temporelles (TD).
Français
modèle de la valeur primaire apprise
Anglais
primary value learned value
PVLV
Sources
Contributeurs: Maya Pentsch, wiki