« Modèle sans MatMul » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(Une version intermédiaire par un autre utilisateur non affichée)
Ligne 25 : Ligne 25 :
[https://www.datacamp.com/blog/matmul-free-language-models  Source : datacamp]
[https://www.datacamp.com/blog/matmul-free-language-models  Source : datacamp]


[[Catégorie:publication]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 24 octobre 2024 à 20:29

Définition

Les modèles sans MatMul désignent des grands modèles de langues dans lesquels les opérations MatMul sont complètement éliminées. Elles sont remplacées par des opérations plus simples, soit l'addition et la soustraction. Ceci rend ces modèles plus efficaces et ils consomment peu de ressources, un peu comme les réseaux neuronaux biologiques.

Voir aussi grand modèle de langues

Français

modèles sans MatMul

modèles sans multiplication matricielle

modèles sans multiplication de matrices

Anglais

MatMul free models

MatMul-free language models

Matmul-free LM

MatMul free models are large language models in wich MatMul operations are completly eliminated. These models are both effective and ressource-efficient, almost like biological neural networks, since the replacement of multiplication-heavy operations with simpler additions and substraction enabled by ternary weight.

Sources

Source : arxiv

Source : datacamp

Contributeurs: Arianne , wiki