Données catégorielles
Domaine
Vocabulaire
Google
Apprentissage profond
Définition
Caractéristiques avec un ensemble discret de valeurs possibles. Par exemple, une caractéristique catégorique nommée «style d'habitation», avec l'ensemble discret de trois valeurs possibles suivant : Tudor, Ranch, Colonial. En représentant «style d'habitation» comme une donnée catégorielle, le modèle peut apprendre l'impact de chaque valeur Tudor, Ranch et Colonial sur la valeur immobilière.
Parfois, les valeurs de l'ensemble discret s'excluent mutuellement, et une seule valeur peut être appliquée à un exemple donné. Par exemple, la caractéristique catégorique car maker n'autoriserait probablement qu'une seule valeur (Toyota) pour chaque exemple. Dans d'autres cas, plusieurs valeurs peuvent s'appliquer. Une voiture peut être peinte de différentes couleurs. Ainsi, la caractéristique catégorique car color autoriserait probablement plusieurs valeurs (par exemple, red et white) pour un exemple.
Les caractéristiques catégoriques sont parfois appelées caractéristiques discrètes.
À comparer aux données numériques.
Termes privilégiés
données catégorielles
Anglais
categorical data
Contributeurs: Claire Gorjux, Jacques Barolet, wiki