Bandits contextuels


Révision datée du 29 janvier 2024 à 10:26 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵↵↵ » par «   »)

Définition

Alors que les algorithmes de bandit manchot vont au-delà des tests A/B/n classiques, véhiculant un grand nombre d'algorithmes pour résoudre différents problèmes, le tout dans le but d'obtenir les meilleurs résultats possibles, ils peuvent également devenir contextuels.

À l'aide d'un flux de données utilisateur pertinent, les bandits contextuels pour l'optimisation du site Web s'appuient sur un flux entrant de données de contexte utilisateur, historiques ou récentes, qui peuvent être utilisées pour prendre de meilleures décisions algorithmiques en temps réel.

Français

Bandits contextuels

Anglais

Contextual bandits

Sources

Source : L'apprentissage profond, Ian Goodfellow, Yoshua Bengio et Aaron Courville Éd. Massot 2018 page 477

Source : dynamicyield.co