« Descente de gradient par lot » : différence entre les versions
m (Remplacement de texte — « Category:Scotty2 » par « <!-- Scotty2 --> ») |
m (Remplacement de texte — « <!-- vocabulaire2 --> » par « <!-- Vocabulaire --> ») |
||
Ligne 1 : | Ligne 1 : | ||
<!-- | <!-- Vocabulaire --> | ||
[[Category:Intelligence artificielle]] | [[Category:Intelligence artificielle]] | ||
[[Catégorie:App-profond-livre2]] | [[Catégorie:App-profond-livre2]] |
Version du 5 juillet 2019 à 11:54
Définition
Variante de l'algorithme descente de gradient où la mise à jour des poids est faite selon la moyenne des gradients sur tout l’ensemble des données d'apprentissage.
Français
descente de gradient par lot n. f
descente de gradient groupée n. f.
descente de gradient par lot unique n. f.
Anglais
batch gradient descent
Source: Bisson, Valentin (2012). Algorithmes d’apprentissage pour la recommandation, thèse de doctorat, Université de Montréal, 96 pages.
Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), Apprentissage profond, Paris, Massot éditions, 800 pages.
Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2016), Deep Learning, Cambridge, The MIT Press, 775 pages.
Contributeurs: Jacques Barolet, Julie Roy, Patrick Drouin, wiki