Réseau neuronal d'espaces d'états structurés


Révision datée du 27 février 2024 à 16:31 par Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== == Compléments == Mamba est exemple de modèle à base de séquences d'espaces d'états structurés développé par des chercheurs de l'Université Carnegie Mellon et de l'Université de Princeton pour répondre à certaines limitations des modèles autoattentifs (''transformers''), en particulier pour le traitement de longues séquences. ==Français== '''modèle à base de séquences d'espaces d'états structurés''... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Compléments

Mamba est exemple de modèle à base de séquences d'espaces d'états structurés développé par des chercheurs de l'Université Carnegie Mellon et de l'Université de Princeton pour répondre à certaines limitations des modèles autoattentifs (transformers), en particulier pour le traitement de longues séquences.

Français

modèle à base de séquences d'espaces d'états structurés

Anglais

structured state space sequence model

S4 model

S4 architecture


Sources

Structured state space sequence model - Wikipedia

Mamba : redéfinir la modélisation des séquences et surpasser l'architecture des transformateurs, Unite.ai