« Encodage un parmi n » : différence entre les versions


m (Claude COULOMBE a déplacé la page Encodage à un bit discriminant vers Encodage un sur n)
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Vecteur creux caractérisé par un élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à chaud est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. <sup>(1)</sup>
Vecteur caractérisé par un seul élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à un sur n est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. <sup>(1)</sup>


Un encodage à chaud consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1.
Un encodage à un sur n consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1.
On peut définir une fonction d'encodage OneHot dans ''scikit-learn'' comme étant la fonction qui prend en entrée un vecteur z et qui redéfinit en sortie la plus grande valeur de z à 1 et toutes autres valeurs de z à 0. <sup>(2)</sup>
 
== Compléments ==
 
Évitez la traduction directe « encodage à chaud ».
 
Un vecteur avec la valeur 1 sur une seule dimension spécifique et 0 partout ailleurs, dans cet encodage, les attributs sont donc mutuellement exclusifs.
 
L'encodage un sur n  produit un « vecteur creux », c'est à dire d'un vecteur contenant beaucoup de valeur nulle. Dans le cas précis d'un encodage un sur n, une seule entrée est non-nulle 


==Français==
==Français==
'''encodage à chaud''' 


'''encodage à un bit non nul discriminant'''  
'''encodage un sur n'''
 
'''encodage 1 sur n'''
 
'''encodage à un bit discriminant'''
 
'''encodage à 1 bit discriminant'''
 
'''encodage un parmi n'''
 
'''encodage 1 parmi n'''
 
'''encodage multibits un bit à la fois'''


'''encodeur OneHot''' (dans scikit-learn)
'''encodage multibits 1 bit à la fois'''


==Anglais==
==Anglais==
'''one-hot encoding'''
'''one-hot encoding'''


'''OneHot Encoding'''
'''OneHot encoding'''





Version du 23 novembre 2022 à 22:18

Définition

Vecteur caractérisé par un seul élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à un sur n est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. (1)

Un encodage à un sur n consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1.

Compléments

Évitez la traduction directe « encodage à chaud ».

Un vecteur avec la valeur 1 sur une seule dimension spécifique et 0 partout ailleurs, dans cet encodage, les attributs sont donc mutuellement exclusifs.

L'encodage un sur n produit un « vecteur creux », c'est à dire d'un vecteur contenant beaucoup de valeur nulle. Dans le cas précis d'un encodage un sur n, une seule entrée est non-nulle

Français

encodage un sur n

encodage 1 sur n

encodage à un bit discriminant

encodage à 1 bit discriminant

encodage un parmi n

encodage 1 parmi n

encodage multibits un bit à la fois

encodage multibits 1 bit à la fois

Anglais

one-hot encoding

OneHot encoding


(1) Source: Google, Machine learning glossary.

(2) Source: Wikipedia,Encodage one-hot.

Source: CODE Q&A, Python - scikit - sklearn metrics.