« Réseau récurrent à portes » : différence entre les versions

Dernière version du 12 août 2025 à 15:20

Définition

Le réseau récurrent à portes est une variante simplifiée et plus rapide à entraîner du réseau récurrent à longue mémoire court terme (LMCT).

Compléments

Le réseau récurrent à portes comporte un seul vecteur d'état et fusionne les portes d'entrée et d'oubli en une porte de mise-à-jour et remplace la porte de sortie par une porte de réinitialisation.

Les réseaux de neurones récurrents à portes ont été développés pour résoudre le problème de l'évanescence du gradient que peuvent poser les réseaux de neurones récurrents réguliers. Ils peuvent être considérés comme une variante des réseaux de neurones récurrents à longue mémoire court terme parce qu'ils sont de conception similaire et produisent des résultats identiques dans beaucoup de cas.

Notons au passage que le réseau de neurones récurrent à portes a été créé en 2014 au laboratoire MILA de l'Université de Montréal.

Français

réseau de neurones récurrent à portes

réseau récurrent à portes

unité récurrente à portes

Anglais

gated recurrent unit

Gated Recurrent Unit

GRU

Sources

Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), Apprentissage profond, Paris, Massot éditions, 800 pages.

[Cho et al, 2014 arxiv - Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation].

Source: Claude Coulombe, Datafranca.org

Source: Termino

@@ Ligne 1 : / Ligne 1 : @@
-[[Category:Intelligence artificielle]]
-[[Category:Apprentissage automatique]]
-[[Category:Apprentissage profond]]
-[[Category:Termino 2019]]
-<!-- Scotty2 -->
-[[Category:GRAND LEXIQUE FRANÇAIS]]
 ==Définition==
-Réseau de neurones récurrent à longue mémoire à court terme qui comporte un seul vecteur d'état, fusionne les portes d'entrée et d'oubli en une porte de mise-à-jour et remplace la porte de sortie par une porte de réinitialisation.
+Le réseau récurrent à portes est une variante simplifiée et plus rapide à entraîner du [[réseau récurrent]] à longue mémoire court terme [[Réseau_récurrent_à_longue_mémoire_court_terme|(LMCT)]].
-Notes: les réseaux de neurones récurrents à portes ont été développés pour résoudre le problème de la disparition du gradient que peuvent poser les réseaux de neurones récurrents réguliers. Ils peuvent être considérés comme une variante des réseaux de neurones récurrents à longue mémoire à court terme parce qu'ils sont de conception similaire et produisent des résultats identiques dans certains cas.
-Notons au passage que le réseau de neurones récurrent à portes a été créé en 2014 au laboratoire MILA [Chung et al, 2014].
+== Compléments ==
+Le réseau récurrent à portes comporte un seul vecteur d'état et fusionne les portes d'entrée et d'oubli en une porte de mise-à-jour et remplace la porte de sortie par une porte de réinitialisation.
+<hr/>
+Les réseaux de neurones récurrents à portes ont été développés pour résoudre le problème de l'[[évanescence du gradient]] que peuvent poser les [[réseau récurrent|réseaux de neurones récurrents]] réguliers. Ils peuvent être considérés comme une variante des [[réseau récurrent à longue mémoire court terme|réseaux de neurones récurrents à longue mémoire court terme]] parce qu'ils sont de conception similaire et produisent des résultats identiques dans beaucoup de cas.
+<hr/>
+Notons au passage que le réseau de neurones récurrent à portes a été créé en 2014 au laboratoire MILA de l'Université de Montréal.
 ==Français==
-'''réseau de neurones récurrent à portes''' <small>loc. nom. masc.</small>
+'''réseau de neurones récurrent à portes'''
-'''réseau récurrent à portes'''  <small>loc. nom. masc.</small>
+'''réseau récurrent à portes'''
-'''unité récurrente à portes'''  <small>loc. nom. fém.</small>
+'''unité récurrente à portes'''
 ==Anglais==
@@ Ligne 27 : / Ligne 22 : @@
 '''GRU'''
+==Sources==
-<small>
+Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), ''Apprentissage profond'', Paris, Massot éditions, 800 pages.
-Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), ''Apprentissage profond'', Paris, Massot éditions, 800 pages.
+[[https://arxiv.org/pdf/1406.1078.pdf Cho et al, 2014] arxiv - Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation].
 [[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]
 [[Utilisateur:Patrickdrouin  | Source: Termino]]
+[[Category:Intelligence artificielle]]
+[[Category:Apprentissage automatique]]
+[[Category:Apprentissage profond]]
+[[Category:GRAND LEXIQUE FRANÇAIS]]

« Réseau récurrent à portes » : différence entre les versions