Réseau récurrent à portes


Révision datée du 1 décembre 2022 à 02:18 par Claude COULOMBE (discussion | contributions) (Claude COULOMBE a déplacé la page Réseau de neurones récurrent à portes vers Réseau récurrent à portes par-dessus une redirection)

Définition

Réseau de neurones récurrent à longue mémoire à court terme qui comporte un seul vecteur d'état, fusionne les portes d'entrée et d'oubli en une porte de mise-à-jour et remplace la porte de sortie par une porte de réinitialisation.

Notes: les réseaux de neurones récurrents à portes ont été développés pour résoudre le problème de la disparition du gradient que peuvent poser les réseaux de neurones récurrents réguliers. Ils peuvent être considérés comme une variante des réseaux de neurones récurrents à longue mémoire à court terme parce qu'ils sont de conception similaire et produisent des résultats identiques dans certains cas.

Notons au passage que le réseau de neurones récurrent à portes a été créé en 2014 au laboratoire MILA [Chung et al, 2014].

Français

réseau de neurones récurrent à portes

réseau récurrent à portes

unité récurrente à portes

Anglais

gated recurrent unit

Gated Recurrent Unit

GRU


Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), Apprentissage profond, Paris, Massot éditions, 800 pages.

Source: Claude Coulombe, Datafranca.org

Source: Termino