Encodage un parmi n


Révision datée du 1 février 2021 à 18:27 par Pitpitt (discussion | contributions) (Remplacement de texte — « <small> masculin </small> » par «  »)

Définition

Vecteur creux caractérisé par un élément ayant la valeur 1 et tous les autres, la valeur 0. L'encodage à chaud est couramment utilisé pour représenter des chaînes ou des identifiants qui ont un ensemble fini de valeurs possibles. (1)

Un encodage à chaud consiste à représenter des états en utilisant pour chacun une valeur dont la représentation binaire n'a qu'un seul chiffre 1. On peut définir une fonction d'encodage OneHot dans scikit-learn comme étant la fonction qui prend en entrée un vecteur z et qui redéfinit en sortie la plus grande valeur de z à 1 et toutes autres valeurs de z à 0. (2)

Français

encodage à chaud

encodage à un bit non nul discriminant

encodeur OneHot (dans scikit-learn)

Anglais

one-hot encoding

OneHot Encoding


(1) Source: Google, Machine learning glossary.

(2) Source: Wikipedia,Encodage one-hot.

Source: CODE Q&A, Python - scikit - sklearn metrics.