« Descente de gradient par lot » : différence entre les versions
m (Remplacement de texte — « <small>loc. nom. fém. </small> » par « <small> féminin </small> ») |
m (Remplacement de texte — « <small> féminin </small> » par « ») |
||
Ligne 3 : | Ligne 3 : | ||
==Français== | ==Français== | ||
'''descente de gradient par lot''' | '''descente de gradient par lot''' | ||
'''descente de gradient groupée''' | '''descente de gradient groupée''' | ||
'''descente de gradient par lot unique''' | '''descente de gradient par lot unique''' | ||
==Anglais== | ==Anglais== |
Version du 1 février 2021 à 18:27
Définition
Variante de l'algorithme descente de gradient où la mise à jour des poids est faite selon la moyenne des gradients sur tout l’ensemble des données d'apprentissage.
Français
descente de gradient par lot
descente de gradient groupée
descente de gradient par lot unique
Anglais
batch gradient descent
Source: Bisson, Valentin (2012). Algorithmes d’apprentissage pour la recommandation, thèse de doctorat, Université de Montréal, 96 pages.
Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), Apprentissage profond, Paris, Massot éditions, 800 pages.
Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2016), Deep Learning, Cambridge, The MIT Press, 775 pages.
Contributeurs: Jacques Barolet, Julie Roy, Patrick Drouin, wiki