« Modèles de bandits » : différence entre les versions

Version du 10 décembre 2019 à 15:24

Définition

Famille d’algorithmes qui propose des stratégies optimales pour maximiser l’espérance d’un gain lors d’une succession de choix entre plusieurs actions aux récompenses inconnues (on parle aussi de maximiser le rendement et de minimiser le regret). Les modèles de bandits sont inspirés du problème de l’optimisation des gains du jeu de hasard que l’on trouve dans les casinos où l’on tire sur le manche d'une machine à sou.

Français

modèles du bandit manchot

modèles du bandit

Anglais

Multi-armed bandit model

N-armed bandit problem

Source: Data Analytics post

[https://en.wikipedia.org/wiki/Multi-armed_bandit Source: Multi-armed bandit

@@ Ligne 11 : / Ligne 11 : @@
 == Français ==
-'''modèles du « bandit manchot » '''
+'''modèles du bandit manchot  '''
+'''modèles du bandit '''
 == Anglais ==
@@ Ligne 21 : / Ligne 24 : @@
 <small>
-[https://dataanalyticspost.com/Lexique/ Source : Data Analytics post]
+[https://dataanalyticspost.com/Lexique/ Source: ''Data Analytics post'']
-[https://en.wikipedia.org/wiki/Multi-armed_bandit  Multi-armed bandit
+[https://en.wikipedia.org/wiki/Multi-armed_bandit  Source: ''Multi-armed bandit''

« Modèles de bandits » : différence entre les versions

Version du 10 décembre 2019 à 15:24

Définition

Français

Anglais

« Modèles de bandits » : différence entre les versions