« Taux d'apprentissage » : différence entre les versions

Version du 20 novembre 2018 à 15:56

Domaine

Définition

Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».

Le taux d'apprentissage est un hyperparamètre clé.

Termes privilégiés

taux d'apprentissage

pas d'apprentissage

gain du gradient

Anglais

learning rate

step size

Source: Google machine learning glossary

Version du 3 octobre 2018 à 19:52 (voir la source) Pitpitt (discussion \| contributions) Aucun résumé des modifications ← Modification précédente		Version du 20 novembre 2018 à 15:56 (voir la source) Jacques (discussion \| contributions) Aucun résumé des modifications Modification suivante →
Ligne 11 :		Ligne 11 :
	Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».		Grandeur scalaire utilisée pour entraîner le modèle via la descente de gradient. À chaque itération, l'algorithme de descente de gradient multiplie le taux d'apprentissage par le gradient. Le produit ainsi généré est appelé «pas de gradient».

	Le taux d'apprentissage est un hyperparamètre clé.		Le taux d'apprentissage est un '''hyperparamètre''' clé.

« Taux d'apprentissage » : différence entre les versions