Encodage un parmi n
Définition
Vecteur creux caractérisé par un élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à chaud est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. (1)
Un encodage à chaud consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1. On peut définir une fonction d'encodage OneHot dans scikit-learn comme étant la fonction qui prend en entrée un vecteur z et qui redéfinit en sortie la plus grande valeur de z à 1 et toutes autres valeurs de z à 0. (2)
Français
encodage à chaud
encodage à un bit non nul discriminant
encodeur OneHot (dans scikit-learn)
Anglais
one-hot encoding
OneHot Encoding
(1) Source: Google, Machine learning glossary.
Contributeurs: Claire Gorjux, Claude Coulombe, Jacques Barolet, wiki, Robert Meloche