Encodage un parmi n


Définition

Vecteur caractérisé par un seul élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à un sur n est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. (1)

Un encodage à un sur n consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1.

Compléments

Évitez la traduction directe « encodage à chaud ».

Un vecteur avec la valeur 1 sur une seule dimension spécifique et 0 partout ailleurs, dans cet encodage, les attributs sont donc mutuellement exclusifs.

L'encodage un sur n produit un « vecteur creux », c'est à dire d'un vecteur contenant beaucoup de valeur nulle. Dans le cas précis d'un encodage un sur n, une seule entrée est non-nulle

Français

encodage un sur n

encodage 1 sur n

encodage à un bit discriminant

encodage à 1 bit discriminant

encodage un parmi n

encodage 1 parmi n

encodage multibits un bit à la fois

encodage multibits 1 bit à la fois

Anglais

one-hot encoding

OneHot encoding


(1) Source: Google, Machine learning glossary.

(2) Source: Wikipedia,Encodage one-hot.

Source: CODE Q&A, Python - scikit - sklearn metrics.