« Classification » : différence entre les versions


(Page créée avec « category:Vocabulaire Cette méthode d’analyse de données regroupe des algorithmes d’apprentissage supervisé adapté aux données qualitatives. L’objectif es... »)
 
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
[[category:Vocabulaire]]




== Domaine ==
[[category:Vocabulaire]]
== Définition ==
Cette méthode d’analyse de données regroupe des algorithmes d’apprentissage supervisé adapté aux données qualitatives. L’objectif est d’apprendre (autrement dit de trouver) la relation qui lie une variable d’intérêt, de type qualitative, aux autres variables observées, éventuellement dans un but de prédiction. On utilise la classification lorsque la variable d’intérêt est qualitative, c’est à dire qu’elle prend ses valeurs dans un espace qui ne possède pas de métrique naturelle. Par exemple on peut essayer de prédire le genre littéraire d’un livre ; cette variable est discrète (genre « policier », genre « science-fiction », etc.) et il n’y a aucune relation entre les genres, il est difficile de définir une distance entre eux.  
Cette méthode d’analyse de données regroupe des algorithmes d’apprentissage supervisé adapté aux données qualitatives. L’objectif est d’apprendre (autrement dit de trouver) la relation qui lie une variable d’intérêt, de type qualitative, aux autres variables observées, éventuellement dans un but de prédiction. On utilise la classification lorsque la variable d’intérêt est qualitative, c’est à dire qu’elle prend ses valeurs dans un espace qui ne possède pas de métrique naturelle. Par exemple on peut essayer de prédire le genre littéraire d’un livre ; cette variable est discrète (genre « policier », genre « science-fiction », etc.) et il n’y a aucune relation entre les genres, il est difficile de définir une distance entre eux.  


Les algorithmes de classification les plus simples sont la régression logistique, le k-nearest neighbour (méthode des k plus proches voisins)… ; les plus complexes sont les réseaux de neurones, les support vector machine, les mixture model (modèles de mélange), le Bayesian classifier (classifieur Bayésien), etc.
Les algorithmes de classification les plus simples sont la régression logistique, le k-nearest neighbour (méthode des k plus proches voisins)… ; les plus complexes sont les réseaux de neurones, les support vector machine, les mixture model (modèles de mélange), le Bayesian classifier (classifieur Bayésien), etc.
== Termes privilégiés ==
== Anglais ==

Version du 26 février 2018 à 20:57


Domaine

Définition

Cette méthode d’analyse de données regroupe des algorithmes d’apprentissage supervisé adapté aux données qualitatives. L’objectif est d’apprendre (autrement dit de trouver) la relation qui lie une variable d’intérêt, de type qualitative, aux autres variables observées, éventuellement dans un but de prédiction. On utilise la classification lorsque la variable d’intérêt est qualitative, c’est à dire qu’elle prend ses valeurs dans un espace qui ne possède pas de métrique naturelle. Par exemple on peut essayer de prédire le genre littéraire d’un livre ; cette variable est discrète (genre « policier », genre « science-fiction », etc.) et il n’y a aucune relation entre les genres, il est difficile de définir une distance entre eux.

Les algorithmes de classification les plus simples sont la régression logistique, le k-nearest neighbour (méthode des k plus proches voisins)… ; les plus complexes sont les réseaux de neurones, les support vector machine, les mixture model (modèles de mélange), le Bayesian classifier (classifieur Bayésien), etc.



Termes privilégiés

Anglais