Mamba


Révision datée du 27 avril 2024 à 00:28 par Claude COULOMBE (discussion | contributions) (Page créée avec « == Définition == Mamba (nom propre) est une architecture d'apprentissage profond du type réseau neuronal d'espaces d'états structurés proposée en décembre 2023 par Albert Gu de Carnegie Mellon University et Tri Dao de Princeton University. == Français == '''Mamba''' == Anglais == '''Mamba''' ==Sources== [https://arxiv.org/pdf/2312.00752 ''Mamba: Linear-Time Sequence Modeling with Selective State Spaces'', arxiv] [https://www.unite.ai/fr/mamba-re... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Mamba (nom propre) est une architecture d'apprentissage profond du type réseau neuronal d'espaces d'états structurés proposée en décembre 2023 par Albert Gu de Carnegie Mellon University et Tri Dao de Princeton University.

Français

Mamba

Anglais

Mamba

Sources

Mamba: Linear-Time Sequence Modeling with Selective State Spaces, arxiv

Mamba : redéfinir la modélisation des séquences et surpasser l'architecture des transformateurs, Unite.ai

Contributeurs: Claude Coulombe, wiki