« Quantification » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
La quantification nous permet de réduire la taille d'un réseau neuronal en convertissant les poids et les biais du réseau de leur format original en virgule flottante (par exemple 32 bits) à un format de moindre précision (par exemple 16 ou 8 bits).  
Technique de compression d'une réseau neuronal qui permet de réduire la taille d'un réseau neuronal en convertissant les poids et les biais du réseau de leur format original en virgule flottante (par exemple 32 bits) à un format de moindre précision (par exemple 16 ou 8 bits).  


==Compléments==
==Compléments==
Le format original en virgule flottante peut varier en fonction de plusieurs facteurs tels que l'architecture du modèle et les processus d'entraînement. L'objectif ultime de la quantification est de réduire la taille de notre modèle, ce qui permet de réduire la mémoire et les besoins de calcul pour exécuter l'inférence et former notre modèle. La quantification peut très vite devenir compliquée si vous essayez de quantifier les modèles vous-même.
L'objectif ultime de la quantification est de réduire la taille de notre modèle, ce qui permet de réduire la consommation de la mémoire et les besoins de calcul pour exécuter l'inférence. Par exemple, pour que le modèle puisse fonctionner sur un téléphone mobile.  
<hr/>
La quantification peut réduire la performance d'un modèle. Il y a donc un compromis à faire entre la taille du modèle et sa précision.
<hr/>
Typiquement, on entraîne le modèle avec un maximum de précision et on utilise la quantification au besoin.  


== Français ==
== Français ==
Ligne 17 : Ligne 21 :


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:Publication]]

Version du 9 janvier 2024 à 14:41

Définition

Technique de compression d'une réseau neuronal qui permet de réduire la taille d'un réseau neuronal en convertissant les poids et les biais du réseau de leur format original en virgule flottante (par exemple 32 bits) à un format de moindre précision (par exemple 16 ou 8 bits).

Compléments

L'objectif ultime de la quantification est de réduire la taille de notre modèle, ce qui permet de réduire la consommation de la mémoire et les besoins de calcul pour exécuter l'inférence. Par exemple, pour que le modèle puisse fonctionner sur un téléphone mobile.


La quantification peut réduire la performance d'un modèle. Il y a donc un compromis à faire entre la taille du modèle et sa précision.


Typiquement, on entraîne le modèle avec un maximum de précision et on utilise la quantification au besoin.

Français

Quantification

Anglais

Quantisation


Source : towardsdatascience

Source : mathworks

Contributeurs: Claude Coulombe, Marie Alfaro, wiki