« Descente de gradient par lot » : différence entre les versions


m (Remplacement de texte — « <!-- vocabulaire2 --> » par « <!-- Vocabulaire --> »)
Aucun résumé des modifications
Ligne 10 : Ligne 10 :


==Français==
==Français==
'''descente de gradient par lot''' n. f
'''descente de gradient par lot''' loc. nom. f.


'''descente de gradient groupée''' n. f.
'''descente de gradient groupée''' loc. nom. f.


'''descente de gradient par lot unique''' n. f.
'''descente de gradient par lot unique''' loc. nom. f.


==Anglais==
==Anglais==
Ligne 29 : Ligne 29 :
Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2016), ''Deep Learning'', Cambridge, The MIT Press, 775 pages.
Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2016), ''Deep Learning'', Cambridge, The MIT Press, 775 pages.


[[Utilisateur:Patrickdrouin  | Source : Termino ]]
[[Utilisateur:Patrickdrouin  | Source : Termino]]

Version du 6 juillet 2019 à 17:17


Définition

Variante de l'algorithme descente de gradient où la mise à jour des poids est faite selon la moyenne des gradients sur tout l’ensemble des données d'apprentissage.

Français

descente de gradient par lot loc. nom. f.

descente de gradient groupée loc. nom. f.

descente de gradient par lot unique loc. nom. f.

Anglais

batch gradient descent



Source: Bisson, Valentin (2012). Algorithmes d’apprentissage pour la recommandation, thèse de doctorat, Université de Montréal, 96 pages.

Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), Apprentissage profond, Paris, Massot éditions, 800 pages.

Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2016), Deep Learning, Cambridge, The MIT Press, 775 pages.

Source : Termino