« Taux d'apprentissage » : différence entre les versions
(Page créée avec « __NOTOC__ == Domaine == Category:VocabulaireVocabulaire<br /> Category:GoogleGoogle<br /> Category:Apprentissage profondApprentissage profond<br /> <br /> ==... ») |
Aucun résumé des modifications |
||
Ligne 8 : | Ligne 8 : | ||
== Définition == | == Définition == | ||
Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé | Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient». | ||
Le taux d'apprentissage est un hyperparamètre clé. | Le taux d'apprentissage est un hyperparamètre clé. | ||
<br /> | <br /> | ||
== Termes privilégiés == | == Termes privilégiés == | ||
=== taux d'apprentissage === | === taux d'apprentissage === |
Version du 2 octobre 2018 à 16:05
Domaine
Vocabulaire
Google
Apprentissage profond
Définition
Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».
Le taux d'apprentissage est un hyperparamètre clé.
Termes privilégiés
taux d'apprentissage
pas d'apprentissage
Anglais
learning rate
step size
Contributeurs: Claire Gorjux, Jacques Barolet, Patrick Drouin, wiki, Robert Meloche