Données catégorielles


Révision datée du 23 mars 2018 à 19:06 par Pitpitt (discussion | contributions) (Page créée avec « __NOTOC__ == Domaine == Category:VocabulaireVocabulaire<br /> Category:GoogleGoogle<br /> Category:Apprentissage profondApprentissage profond<br /> <br /> ==... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Domaine

Vocabulaire
Google
Apprentissage profond


Définition

Caractéristiques avec un ensemble discret de valeurs possibles. Par exemple, une caractéristique catégorique nommée house style, avec l'ensemble discret de trois valeurs possibles suivant : Tudor, ranch, colonial. En représentant house style comme une donnée catégorielle, le modèle peut apprendre l'impact de chaque valeur Tudor, ranch et colonial sur la valeur immobilière.

Parfois, les valeurs de l'ensemble discret s'excluent mutuellement, et une seule valeur peut être appliquée à un exemple donné. Par exemple, la caractéristique catégorique car maker n'autoriserait probablement qu'une seule valeur (Toyota) pour chaque exemple. Dans d'autres cas, plusieurs valeurs peuvent s'appliquer. Une voiture peut être peinte de différentes couleurs. Ainsi, la caractéristique catégorique car color autoriserait probablement plusieurs valeurs (par exemple, red et white) pour un exemple.

Les caractéristiques catégoriques sont parfois appelées caractéristiques discrètes.

À comparer aux données numériques.



Termes privilégiés

données catégorielles


Anglais

categorical data




Source: Google machine learning glossary