« Modèles de bandits » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 8 : | Ligne 8 : | ||
== Définition == | == Définition == | ||
Famille d’algorithmes qui propose des stratégies optimales pour maximiser l’espérance d’un gain lors d’une succession de choix entre plusieurs actions aux récompenses inconnues (on parle aussi de maximiser le rendement et de minimiser le regret). Les modèles de | Famille d’algorithmes qui propose des stratégies optimales pour maximiser l’espérance d’un gain lors d’une succession de choix entre plusieurs actions aux récompenses inconnues (on parle aussi de maximiser le rendement et de minimiser le regret). Les modèles de bandits sont inspirés du problème de l’optimisation des gains du jeu de hasard que l’on trouve dans les casinos où l’on tire sur le manche d'une machine à sou. | ||
== Français == | == Français == | ||
'''modèles du | '''modèles du bandits manchot ''' <small>loc. nom. masc</small> | ||
'''modèles du | '''modèles du bandits ''' <small>loc. nom. masc</small> | ||
Version du 10 décembre 2019 à 14:28
Définition
Famille d’algorithmes qui propose des stratégies optimales pour maximiser l’espérance d’un gain lors d’une succession de choix entre plusieurs actions aux récompenses inconnues (on parle aussi de maximiser le rendement et de minimiser le regret). Les modèles de bandits sont inspirés du problème de l’optimisation des gains du jeu de hasard que l’on trouve dans les casinos où l’on tire sur le manche d'une machine à sou.
Français
modèles du bandits manchot loc. nom. masc
modèles du bandits loc. nom. masc
Anglais
Multi-armed bandit model
N-armed bandit problem
Contributeurs: Claire Gorjux, Jacques Barolet, wiki