Taux d’apprentissage

Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, lalgorithme de descente de gradient multiplie le taux dapprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».

Le taux dapprentissage est un hyperparamètre clé.

 

Français

taux dapprentissage

pas dapprentissage

gain du gradient

 

Anglais

learning rate

step size

Source: Google machine learning glossary