« Modèle sans MatMul » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==
Les modèles sans MatMul désignent des grands modèles de langues dans lesquels les opérations '''[[MatMul]]''' sont complètement éliminées. Elles sont remplacées par des opérations plus simples, soit l'addition et la soustraction. Ceci rend ces modèles plus efficaces et ils consomment peu de ressources, un peu comme les réseaux neuronaux biologiques.


== Définition ==
Voir aussi '''[[grand modèle de langues]]'''
xxxxx


== Français ==
== Français ==
''' modèles sans MatMul'''
''' modèles sans multiplication matricielle'''
''' modèles sans multiplication matricielle'''
''' modèles sans MatMul'''


''' modèles sans multiplication de matrices'''
''' modèles sans multiplication de matrices'''
Ligne 25 : Ligne 25 :
[https://www.datacamp.com/blog/matmul-free-language-models  Source : datacamp]
[https://www.datacamp.com/blog/matmul-free-language-models  Source : datacamp]


[[Catégorie:vocabulary]]
[[Catégorie:publication]]

Version du 22 octobre 2024 à 11:34

Définition

Les modèles sans MatMul désignent des grands modèles de langues dans lesquels les opérations MatMul sont complètement éliminées. Elles sont remplacées par des opérations plus simples, soit l'addition et la soustraction. Ceci rend ces modèles plus efficaces et ils consomment peu de ressources, un peu comme les réseaux neuronaux biologiques.

Voir aussi grand modèle de langues

Français

modèles sans MatMul

modèles sans multiplication matricielle

modèles sans multiplication de matrices

Anglais

MatMul free models

MatMul-free language models

Matmul-free LM

MatMul free models are large language models in wich MatMul operations are completly eliminated. These models are both effective and ressource-efficient, almost like biological neural networks, since the replacement of multiplication-heavy operations with simpler additions and substraction enabled by ternary weight.

Sources

Source : arxiv

Source : datacamp

Contributeurs: Arianne