« Regroupement de données » : différence entre les versions
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Le regroupement de données (clustering) est une méthode d'''[[Analyse des données|analyse des données]]'' dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de | Le regroupement de données (clustering) est une méthode d''''[[Analyse des données|analyse des données]]''' dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de partitionnement de données) selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs. | ||
Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’''[[Apprentissage non supervisé|apprentissage non supervisé]]''. | Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’'''[[Apprentissage non supervisé|apprentissage non supervisé]]'''. | ||
==Compléments== | ==Compléments== | ||
Note - Le regroupement de données (''clustering'') est la principale tâche de l’''[[Apprentissage non supervisé|apprentissage non supervisé]]'' en [[analyse des données]]. | Note - Le regroupement de données (''clustering'') est la principale tâche de l’'''[[Apprentissage non supervisé|apprentissage non supervisé]]''' en '''[[analyse des données]]'''. | ||
En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données. | En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données. | ||
Ligne 12 : | Ligne 12 : | ||
== Français == | == Français == | ||
'''regroupement de données | '''regroupement de données''' | ||
'''groupement de données''' | '''groupement de données''' | ||
Ligne 18 : | Ligne 18 : | ||
'''agrégation de données''' | '''agrégation de données''' | ||
'''partitionnement de données ''' | '''partitionnement de données''' | ||
'''segmentation de données | '''segmentation de données''' | ||
== Anglais == | == Anglais == | ||
'''clustering | '''clustering ''' | ||
'''data clustering | '''data clustering''' | ||
'''binning''' | '''binning''' |
Version du 31 janvier 2024 à 17:59
Définition
Le regroupement de données (clustering) est une méthode d'analyse des données dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de partitionnement de données) selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs.
Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé.
Compléments
Note - Le regroupement de données (clustering) est la principale tâche de l’apprentissage non supervisé en analyse des données.
En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données.
Français
regroupement de données
groupement de données
agrégation de données
partitionnement de données
segmentation de données
Anglais
clustering
data clustering
binning
Sources
Contributeurs: Evan Brach, Claude Coulombe, Imane Meziani, wiki, Sihem Kouache