« RetNet » : différence entre les versions

Version du 3 octobre 2023 à 14:19

Architecture de réseau neuronal profond combinant les propriétés d'un réseau neuronal récurrent et un mécanisme d'auto-attention.

architecture RetNet

RetNet

Source : medium.com

@@ Ligne 1 : / Ligne 1 : @@
-==en construction==
 == Définition ==
 Architecture de réseau neuronal profond combinant les propriétés d'un [[réseau neuronal récurrent]] et un [[R%C3%A9seau_autoattentif|mécanisme d'auto-attention]].
@@ Ligne 9 : / Ligne 7 : @@
 == Anglais ==
 ''' RetNet'''
 <!--  It is foundational architecture for LLMs, simultaneously achieving training parallelism, low-cost inference, and good performance.-->
 <small>
@@ Ligne 18 : / Ligne 13 : @@
 [https://medium.com/aiguys/retnet-transformer-killer-is-here-1dc7f50d1205   Source : medium.com]
+[https://arxiv.org/abs/2307.08621  Source: Sun et al. 2023]
-[[Catégorie:vocabulary]]
+[[Catégorie:Publication]]