« Taux d'apprentissage » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 11 : | Ligne 11 : | ||
Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient». | Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient». | ||
Le taux d'apprentissage est un hyperparamètre clé. | Le taux d'apprentissage est un '''hyperparamètre''' clé. | ||
Version du 20 novembre 2018 à 14:56
Domaine
Définition
Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».
Le taux d'apprentissage est un hyperparamètre clé.
Termes privilégiés
taux d'apprentissage
pas d'apprentissage
gain du gradient
Anglais
learning rate
step size
Contributeurs: Claire Gorjux, Jacques Barolet, Patrick Drouin, wiki, Robert Meloche