Données catégorielles


Domaine

Vocabulaire
Google
Apprentissage profond


Définition

Caractéristiques avec un ensemble discret de valeurs possibles. Par exemple, une caractéristique catégorique nommée «style d'habitation», avec l'ensemble discret de trois valeurs possibles suivant : Tudor, Ranch, Colonial. En représentant «style d'habitation» comme une donnée catégorielle, le modèle peut apprendre l'impact de chaque valeur Tudor, Ranch et Colonial sur la valeur immobilière.

Parfois, les valeurs de l'ensemble discret s'excluent mutuellement, et une seule valeur peut être appliquée à un exemple donné. Par exemple, la caractéristique catégorique car maker n'autoriserait probablement qu'une seule valeur (Toyota) pour chaque exemple. Dans d'autres cas, plusieurs valeurs peuvent s'appliquer. Une voiture peut être peinte de différentes couleurs. Ainsi, la caractéristique catégorique car color autoriserait probablement plusieurs valeurs (par exemple, red et white) pour un exemple.

Les caractéristiques catégoriques sont parfois appelées caractéristiques discrètes.

À comparer aux données numériques.



Termes privilégiés

données catégorielles


Anglais

categorical data




Source: Google machine learning glossary