« Taux d'apprentissage » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 3 : | Ligne 3 : | ||
[[Category:Vocabulaire]]Vocabulaire<br /> | [[Category:Vocabulaire]]Vocabulaire<br /> | ||
[[Category:Google]]Google<br /> | [[Category:Google]]Google<br /> | ||
[[Category:Claude]]Claude<br /> | |||
[[Category:Apprentissage profond]]Apprentissage profond<br /> | [[Category:Apprentissage profond]]Apprentissage profond<br /> | ||
[[Category:9]] | [[Category:9]] | ||
Ligne 21 : | Ligne 22 : | ||
== Termes privilégiés == | == Termes privilégiés == | ||
=== taux d'apprentissage === | === taux d'apprentissage === | ||
=== pas d'apprentissage === | === pas d'apprentissage === | ||
=== gain du gradient === | |||
<br /> | <br /> | ||
Ligne 29 : | Ligne 29 : | ||
== Anglais == | == Anglais == | ||
=== | ===learning rate=== | ||
===step size=== | ===step size=== | ||
<br/> | <br/> | ||
<br/> | <br/> |
Version du 2 octobre 2018 à 16:38
Domaine
Vocabulaire
Google
Claude
Apprentissage profond
Définition
Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».
Le taux d'apprentissage est un hyperparamètre clé.
Termes privilégiés
taux d'apprentissage
pas d'apprentissage
gain du gradient
Anglais
learning rate
step size
Contributeurs: Claire Gorjux, Jacques Barolet, Patrick Drouin, wiki, Robert Meloche