« MatMul » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Scalable MatMul-free Language Modeling ''' Matrix multiplication (MatMul) typically dominates the overall computational cost of large language models (LLMs). This cost only grows as LLMs scale to larger embedding dimensions and context lengths. In this work, we show that MatMul operations can be completely eliminated from LLMs while maintaining strong perform... ») |
Aucun résumé des modifications |
||
(3 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== | == Définition == | ||
La multiplication matricielle (MatMul) est l'opération dominante dans la plupart des réseaux neuronaux et elle domine généralement le coût de calcul global des grands modèles de langues, consommant souvent la majorité du temps d'exécution et de l'accès à la mémoire pendant les phases d''''[[apprentissage]]''' et d''''[[inférence]]'''. La prédominance de MatMul est principalement due au fait que les unités de traitement graphique (GPU) sont optimisées pour les opérations MatMul. | |||
Voir aussi '''[[grand modèle de langues]]''', '''[[réseau neuronal]]''' et '''[[unité de traitement graphique]]''' | |||
== Français == | == Français == | ||
''' | ''' MatMul''' | ||
''' multiplication de matrices''' | |||
''' multiplication matricielle ''' | |||
== Anglais == | == Anglais == | ||
''' | ''' MatMul ''' | ||
''' matrix multiplication''' | |||
''Matrix Multiplication (MatMul) is the dominant operation in most neural network and it typically dominates the overall computational cost of Large Language Models, often consuming the majority of the execution time and memory access during both training and inference phases. The prevalence of MatMul is primarily due to Graphics Processing Units (GPUs) being optimized for MatMul operations.'' | |||
== Source == | == Source == | ||
[https:// | [https://arxiv.org/abs/2406.02528 Source : arxiv] | ||
[https://www.datacamp.com/blog/matmul-free-language-models Source : datacamp] | |||
[[Catégorie: | [[Catégorie:ENGLISH]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 30 septembre 2024 à 16:31
Définition
La multiplication matricielle (MatMul) est l'opération dominante dans la plupart des réseaux neuronaux et elle domine généralement le coût de calcul global des grands modèles de langues, consommant souvent la majorité du temps d'exécution et de l'accès à la mémoire pendant les phases d'apprentissage et d'inférence. La prédominance de MatMul est principalement due au fait que les unités de traitement graphique (GPU) sont optimisées pour les opérations MatMul.
Voir aussi grand modèle de langues, réseau neuronal et unité de traitement graphique
Français
MatMul
multiplication de matrices
multiplication matricielle
Anglais
MatMul
matrix multiplication
Matrix Multiplication (MatMul) is the dominant operation in most neural network and it typically dominates the overall computational cost of Large Language Models, often consuming the majority of the execution time and memory access during both training and inference phases. The prevalence of MatMul is primarily due to Graphics Processing Units (GPUs) being optimized for MatMul operations.