Encodage un parmi n


Révision datée du 7 mai 2020 à 12:21 par Pitpitt (discussion | contributions) (Remplacement de texte — « <br /> » par «  »)

Définition

Vecteur creux caractérisé par un élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à chaud est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. (1)

Un encodage à chaud consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1. On peut définir une fonction d'encodage OneHot dans scikit-learn comme étant la fonction qui prend en entrée un vecteur z et qui redéfinit en sortie la plus grande valeur de z à 1 et toutes autres valeurs de z à 0. (2)

Français

encodage à chaud loc. nom. masc.

encodage à un bit non nul discriminant loc. nom. masc.

encodeur OneHot (dans scikit-learn) loc. nom. masc.

Anglais

one-hot encoding

OneHot Encoding


(1) Source: Google, Machine learning glossary.

(2) Source: Wikipedia,Encodage one-hot.

Source: CODE Q&A, Python - scikit - sklearn metrics.