« Adadelta » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵↵==Sources== » par « ==Sources== ») |
||
(7 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Adadelta est un algorithme d'apprentissage basé sur la descente de gradient qui adapte | Adadelta est un algorithme d'apprentissage basé sur la descente de gradient qui adapte le taux d'apprentissage par paramètre. Il a été proposé comme une amélioration à '''[[Adagrad]]''', qui est plus sensible aux hyperparamètres et peut diminuer le taux d'apprentissage de manière significative. | ||
== Français == | == Français == | ||
Ligne 7 : | Ligne 7 : | ||
== Anglais == | == Anglais == | ||
'''Adadelta''' | '''Adadelta''' | ||
==Sources== | |||
[https://golden.com/wiki/Adadelta Source : Golden.com ] | [https://golden.com/wiki/Adadelta Source : Golden.com ] | ||
Ligne 14 : | Ligne 13 : | ||
[[Catégorie:ENGLISH]] | [[Catégorie:ENGLISH]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
Dernière version du 30 août 2024 à 14:01
Définition
Adadelta est un algorithme d'apprentissage basé sur la descente de gradient qui adapte le taux d'apprentissage par paramètre. Il a été proposé comme une amélioration à Adagrad, qui est plus sensible aux hyperparamètres et peut diminuer le taux d'apprentissage de manière significative.
Français
Adadelta
Anglais
Adadelta
Sources
Contributeurs: Claude Coulombe, Imane Meziani, wiki, Sihem Kouache