Mamba


Définition

Mamba (nom propre) est une architecture d'apprentissage profond du type réseau neuronal d'espaces d'états structurés proposée en décembre 2023 par Albert Gu de Carnegie Mellon University et Tri Dao de Princeton University.

Français

Mamba

Anglais

Mamba

Sources

Mamba: Linear-Time Sequence Modeling with Selective State Spaces, arxiv

Mamba : redéfinir la modélisation des séquences et surpasser l'architecture des transformateurs, Unite.ai

Contributeurs: Claude Coulombe, wiki