« RetNet » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 18 : Ligne 18 :
[https://arxiv.org/abs/2307.08621  Source: Sun et al. 2023]
[https://arxiv.org/abs/2307.08621  Source: Sun et al. 2023]


[[Catégorie:Publication]]
[[Catégorie:ENGLISH]]
 
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Version du 3 octobre 2023 à 19:58

Définition

Architecture de réseau neuronal profond principalement utilisé pour l'entraînement des grands modèles de langues qui combine les propriétés d'un réseau neuronal récurrent et un mécanisme d'auto-attention.

Complément

RetNet est mot valise qui signifie Retentive Network.

Français

architecture RetNet

Anglais

RetNet

Source : medium.com

Source: Sun et al. 2023

Contributeurs: Patrick Drouin, wiki