« Classification » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
==Domaine== | |||
== Domaine == | |||
[[category:Vocabulaire]] | [[category:Vocabulaire]] | ||
[[category:scotty]] | [[category:scotty]] | ||
[[category:9]] | [[category:9]] | ||
== Définition == | ==Définition== | ||
Méthode d’analyse de données qui regroupe des algorithmes d’apprentissage supervisé adaptés aux données qualitatives. L’objectif est d’apprendre (autrement dit de trouver) la relation qui lie une variable d’intérêt, de type qualitative, aux autres variables observées, éventuellement dans un but de prédiction. On utilise la classification lorsque la variable d’intérêt est qualitative, c’est-à-dire qu’elle prend ses valeurs dans un espace qui ne possède pas de métrique naturelle. Par exemple on peut essayer de prédire le genre littéraire d’un livre : cette variable est discrète (genre « policier », genre « science-fiction », etc.) et il n’y a aucune relation entre les genres | Méthode d’analyse de données qui regroupe des algorithmes d’apprentissage supervisé adaptés aux données qualitatives. L’objectif est d’apprendre (autrement dit de trouver) la relation qui lie une variable d’intérêt, de type qualitative, aux autres variables observées, éventuellement dans un but de prédiction. On utilise la classification lorsque la variable d’intérêt est qualitative, c’est-à-dire qu’elle prend ses valeurs dans un espace qui ne possède pas de métrique naturelle. Par exemple on peut essayer de prédire le genre littéraire d’un livre : cette variable est discrète (genre « policier », genre « science-fiction », etc.) et il n’y a aucune relation entre les genres et il est difficile de définir une distance entre eux. | ||
Les algorithmes de classification les plus simples sont la régression logistique, | Les algorithmes de classification les plus simples sont la régression logistique, la méthode des k plus proches voisins (''k-nearest neighbour'') ; les plus complexes sont les réseaux de neurones, les séparateurs à vaste marge (''support vector machine)'', les modèles de mélange (''mixture models)'' et le classifieur Bayésien (''Bayesian classifier).'' | ||
== Français == | ==Français== | ||
'''Classification''' n.f. | '''Classification''' n.f. | ||
==Anglais== | |||
== Anglais == | |||
'''Classification''' | '''Classification''' | ||
Source : Claude Coulombe, DataFranca.org | |||
<br /> |
Version du 20 avril 2019 à 17:50
Domaine
Définition
Méthode d’analyse de données qui regroupe des algorithmes d’apprentissage supervisé adaptés aux données qualitatives. L’objectif est d’apprendre (autrement dit de trouver) la relation qui lie une variable d’intérêt, de type qualitative, aux autres variables observées, éventuellement dans un but de prédiction. On utilise la classification lorsque la variable d’intérêt est qualitative, c’est-à-dire qu’elle prend ses valeurs dans un espace qui ne possède pas de métrique naturelle. Par exemple on peut essayer de prédire le genre littéraire d’un livre : cette variable est discrète (genre « policier », genre « science-fiction », etc.) et il n’y a aucune relation entre les genres et il est difficile de définir une distance entre eux.
Les algorithmes de classification les plus simples sont la régression logistique, la méthode des k plus proches voisins (k-nearest neighbour) ; les plus complexes sont les réseaux de neurones, les séparateurs à vaste marge (support vector machine), les modèles de mélange (mixture models) et le classifieur Bayésien (Bayesian classifier).
Français
Classification n.f.
Anglais
Classification
Source : Claude Coulombe, DataFranca.org
Contributeurs: Claire Gorjux, Claude Coulombe, Jacques Barolet, wiki