« Adadelta » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Adadelta est un algorithme d'apprentissage basé sur la descente de gradient qui adapte le taux d'apprentissage par paramètre au fil du temps. Il a été proposé comme une amélioration par rapport à [[Adagrad]], qui est plus sensible aux hyperparamètres et peut diminuer le taux d'apprentissage de manière trop agressive. | Adadelta est un algorithme d'apprentissage basé sur la descente de gradient qui adapte le taux d'apprentissage par paramètre au fil du temps. Il a été proposé comme une amélioration par rapport à '''[[Adagrad]]''', qui est plus sensible aux hyperparamètres et peut diminuer le taux d'apprentissage de manière trop agressive. | ||
== Français == | == Français == |
Version du 4 juin 2020 à 07:44
Définition
Adadelta est un algorithme d'apprentissage basé sur la descente de gradient qui adapte le taux d'apprentissage par paramètre au fil du temps. Il a été proposé comme une amélioration par rapport à Adagrad, qui est plus sensible aux hyperparamètres et peut diminuer le taux d'apprentissage de manière trop agressive.
Français
Adadelta
Anglais
Adadelta
Contributeurs: Claude Coulombe, Imane Meziani, wiki, Sihem Kouache