« Poids ternaire » : différence entre les versions
m (Patrickdrouin a déplacé la page Ternary weight vers Poids ternaire) |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
[[Poids]] ou paramètre utilisé dans un [[réseau de neurones artificiel|réseau de neurones artificiels]] pouvant prendre trois valeurs ou états distincts, typiquement -1, 0 ou 1. | [[Poids]] ou paramètre utilisé dans un [[réseau de neurones artificiel|réseau de neurones artificiels]] pouvant prendre trois valeurs ou états distincts, typiquement -1, 0 ou 1. | ||
== Complément == | |||
Les poids ternaires constitue une méthode de [[quantification]] utilisée pour réduire la taille des réseaux de neurones, particulièrement des [[Grand modèles de langues|grands modèles de langues]]. | |||
== Français == | == Français == | ||
Ligne 13 : | Ligne 16 : | ||
[https://www.btb.termiumplus.gc.ca Source : Termium] | [https://www.btb.termiumplus.gc.ca Source : Termium] | ||
[https://arxiv.org/abs/2410.16144 Source : Wang et al. 2024] | |||
[[Catégorie:Publication]] | [[Catégorie:Publication]] |
Version du 5 novembre 2024 à 15:13
Définition
Poids ou paramètre utilisé dans un réseau de neurones artificiels pouvant prendre trois valeurs ou états distincts, typiquement -1, 0 ou 1.
Complément
Les poids ternaires constitue une méthode de quantification utilisée pour réduire la taille des réseaux de neurones, particulièrement des grands modèles de langues.
Français
poids ternaire
Anglais
ternary weight
Sources
Contributeurs: Patrick Drouin, wiki