Encodage un parmi n



Définition

Vecteur creux caractérisé par un élément ayant la valeur 1 et tous les autres la valeur 0. L'encodage à chaud est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. (1)

Un encodage à chaud consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1. On peut définir une fonction d'encodage OneHot dans scikit-learn comme étant la fonction qui prend en entrée un vecteur z et qui redéfinit en sortie la plus grande valeur de z à 1 et toutes autres valeurs de z à 0. (2)


Français

encodage à chaud n.m.

encodeur OneHot (dans scikit-learn) n.m.



Anglais

one-hot encoding

OneHotEncoding


(1) Source: Google machine learning glossary

(2) Source: Wikipedia

Source: CODE Q&A