Mamba


Révision datée du 29 avril 2024 à 20:04 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Mamba (nom propre) est une architecture d'apprentissage profond du type réseau neuronal d'espaces d'états structurés proposée en décembre 2023 par Albert Gu de Carnegie Mellon University et Tri Dao de Princeton University.

Français

Mamba

Anglais

Mamba

Sources

Mamba: Linear-Time Sequence Modeling with Selective State Spaces, arxiv

Mamba : redéfinir la modélisation des séquences et surpasser l'architecture des transformateurs, Unite.ai

Contributeurs: Claude Coulombe, wiki