« Regroupement de données » : différence entre les versions

Dernière version du 28 mai 2024 à 17:16

Définition

Le regroupement de données (clustering) est une méthode d'analyse des données dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de partitionnement de données) selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs.

Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé.

Compléments

Note - Le regroupement de données (clustering) est la principale tâche de l’apprentissage non supervisé en analyse des données.

En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données.

Français

regroupement de données

groupement de données

agrégation de données

partitionnement de données

segmentation de données

Anglais

clustering

data clustering

binning

Sources

Source : GDT - Traitement des données

@@ Ligne 1 : / Ligne 1 : @@
 == Définition ==
-Méthode d'analyse des données dans laquelle celles-ci sont réparties dans des groupes distincts, sur la base de caractéristiques communes ou de différences, qui sont repérées par des systèmes logiciels fonctionnant librement.
-Notes
+Le regroupement de données (clustering) est une méthode d''''[[Analyse des données|analyse des données]]''' dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de partitionnement de données) selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs.
-Le groupement de données par classe est une forme d'analyse par groupe.
+Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’'''[[Apprentissage non supervisé|apprentissage non supervisé]]'''.
-Cette méthode d'analyse de données est semblable à celle de l'apprentissage non supervisé de l'intelligence artificielle.
+==Compléments==
+Note - Le regroupement de données (''clustering'') est la principale tâche de l’'''[[Apprentissage non supervisé|apprentissage non supervisé]]''' en '''[[analyse des données]]'''.
+En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données.
 == Français ==
-'''groupement de données par classe '''    <small> masculin </small>
+'''regroupement de données'''
-'''partitionnement de données '''    <small> masculin </small>
+'''groupement de données'''
-'''regroupement de données   '''   <small> masculin </small>
+'''agrégation de données'''
-'''segmentation de données   '''   <small> féminin </small>
+'''partitionnement de données'''
+'''segmentation de données'''
 == Anglais ==
-'''data clustering   '''
+'''clustering '''
-'''clustering  '''
-'''binning   '''
+'''data clustering'''
-<small>
+'''binning'''
-[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26557645   Source : GDT - Traitement des données ]
+==Sources==
+[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26557645 Source : GDT - Traitement des données ]
+{{Modèle:GDT}}
 [[Catégorie:Traitement de données]]
 [[Catégorie:GRAND LEXIQUE FRANÇAIS]]
-[[Catégorie:Scotty2]]

« Regroupement de données » : différence entre les versions