« Bandits contextuels » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵↵<small> » par «  ==Sources==  »)
Ligne 10 : Ligne 10 :
'''Contextual bandits'''
'''Contextual bandits'''


<small>
==Sources==
 


[https://www.apprentissageprofond.org/  Source :  ''L'apprentissage profond'',  Ian Goodfellow, Yoshua Bengio et Aaron Courville  Éd. Massot 2018 page 477  ]
[https://www.apprentissageprofond.org/  Source :  ''L'apprentissage profond'',  Ian Goodfellow, Yoshua Bengio et Aaron Courville  Éd. Massot 2018 page 477  ]

Version du 27 janvier 2024 à 19:19

Définition

Alors que les algorithmes de bandit manchot vont au-delà des tests A/B/n classiques, véhiculant un grand nombre d'algorithmes pour résoudre différents problèmes, le tout dans le but d'obtenir les meilleurs résultats possibles, ils peuvent également devenir contextuels.

À l'aide d'un flux de données utilisateur pertinent, les bandits contextuels pour l'optimisation du site Web s'appuient sur un flux entrant de données de contexte utilisateur, historiques ou récentes, qui peuvent être utilisées pour prendre de meilleures décisions algorithmiques en temps réel.

Français

Bandits contextuels

Anglais

Contextual bandits

Sources

Source : L'apprentissage profond, Ian Goodfellow, Yoshua Bengio et Aaron Courville Éd. Massot 2018 page 477

Source : dynamicyield.co