« RetNet » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
 
Architecture de réseau neuronal profond combinant les propriétés d'un [[réseau neuronal récurrent]] et un [[R%C3%A9seau_autoattentif|mécanisme d'auto-attention]]. 


== Français ==
== Français ==
Ligne 11 : Ligne 11 :




  It is foundational architecture for LLMs, simultaneously achieving training parallelism, low-cost inference, and good performance.
<!--  It is foundational architecture for LLMs, simultaneously achieving training parallelism, low-cost inference, and good performance.-->
   
   



Version du 3 octobre 2023 à 14:18

en construction

Définition

Architecture de réseau neuronal profond combinant les propriétés d'un réseau neuronal récurrent et un mécanisme d'auto-attention.

Français

architecture RetNet

Anglais

RetNet



Source : medium.com



Contributeurs: Patrick Drouin, wiki