« MatMul » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
XXXXXXXXX
La multiplication matricielle (MatMul) est l'opération dominante dans la plupart des réseaux neuronaux et elle domine généralement le coût de calcul global des grands modèles de langues, consommant souvent la majorité du temps d'exécution et de l'accès à la mémoire pendant les phases d''''[[apprentissage]]''' et d''''[[inférence]]'''. La prédominance de MatMul est principalement due au fait que les unités de traitement graphique (GPU) sont optimisées pour les opérations MatMul.
 
Voir aussi '''[[grand modèle de langues]]''', '''[[réseau neuronal]]''' et '''[[unité de traitement graphique]]'''


== Français ==
== Français ==
''' XXXXXXXXX '''
''' MatMul'''
 
''' multiplication matricielle '''
 
''' multiplication de matrices'''


== Anglais ==
== Anglais ==
'''Matrix multiplication'''
''' MatMul '''


''' Scalable MatMul-free Language Modeling '''
''' Matrix multiplication'''


  Matrix multiplication (MatMul) typically dominates the overall computational cost of large language models (LLMs). This cost only grows as LLMs scale to larger embedding dimensions and context lengths. In this work, we show that MatMul operations can be completely eliminated from LLMs while maintaining strong performance at billion-parameter scales. 
''Matrix Multiplication (MatMul) is the dominant operation in most neural network and it typically dominates the overall computational cost of Large Language Models, often consuming the majority of the execution time and memory access during both training and inference phases. The prevalence of MatMul is primarily due to Graphics Processing Units (GPUs) being optimized for MatMul operations.''


== Source ==
== Source ==


[https://huggingface.co/papers/2406.02528  Source : huggingface]
[https://arxiv.org/abs/2406.02528  Source : arxiv]
 
[https://www.datacamp.com/blog/matmul-free-language-models  Source : datacamp]




[[Catégorie:vocabulary]]
[[Catégorie:publication]]

Version du 30 septembre 2024 à 14:27

en construction

Définition

La multiplication matricielle (MatMul) est l'opération dominante dans la plupart des réseaux neuronaux et elle domine généralement le coût de calcul global des grands modèles de langues, consommant souvent la majorité du temps d'exécution et de l'accès à la mémoire pendant les phases d'apprentissage et d'inférence. La prédominance de MatMul est principalement due au fait que les unités de traitement graphique (GPU) sont optimisées pour les opérations MatMul.

Voir aussi grand modèle de langues, réseau neuronal et unité de traitement graphique

Français

MatMul

multiplication matricielle

multiplication de matrices

Anglais

MatMul

Matrix multiplication

Matrix Multiplication (MatMul) is the dominant operation in most neural network and it typically dominates the overall computational cost of Large Language Models, often consuming the majority of the execution time and memory access during both training and inference phases. The prevalence of MatMul is primarily due to Graphics Processing Units (GPUs) being optimized for MatMul operations.

Source

Source : arxiv

Source : datacamp

Contributeurs: Arianne , wiki