« Adadelta » : différence entre les versions


Ligne 1 : Ligne 1 :
== Domaine ==
== Domaine ==
[[category:Vocabulary]]  Vocabulary<br />
 


[[Catégorie:Apprentissage profond]] Apprentissage profond<br />
[[Catégorie:Apprentissage profond]] Apprentissage profond<br />
[[Category:Vocabulary]]Vocabulary<br />
[[Category:Coulombe]]Coulombe<br />


== Définition ==
== Définition ==

Version du 29 janvier 2019 à 22:33

Domaine

Apprentissage profond
Vocabulary
Coulombe

Définition

Français

Adadelta

Algorithme d'optimisation de la descente de gradient.

Anglais

Adadelta

Adadelta is a gradient descent based learning algorithm that adapts the learning rate per parameter over time. It was proposed as an improvement over Adagrad, which is more sensitive to hyperparameters and may decrease the learning rate too aggressively. Adadelta It is similar to rmsprop and can be used instead of vanilla SGD.

  • ADADELTA: An Adaptive Learning Rate Method
  • Stanford CS231n: Optimization Algorithms
  • An overview of gradient descent optimization algorithms