« RetNet » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
Architecture de réseau neuronal profond combinant les propriétés d'un [[réseau neuronal récurrent]] et un [[R%C3%A9seau_autoattentif|mécanisme d'auto-attention]]. | |||
== Français == | == Français == | ||
Ligne 11 : | Ligne 11 : | ||
<!-- It is foundational architecture for LLMs, simultaneously achieving training parallelism, low-cost inference, and good performance.--> | |||
Version du 3 octobre 2023 à 13:18
en construction
Définition
Architecture de réseau neuronal profond combinant les propriétés d'un réseau neuronal récurrent et un mécanisme d'auto-attention.
Français
architecture RetNet
Anglais
RetNet
Contributeurs: Patrick Drouin, wiki