« Regroupement de données » : différence entre les versions
m (Remplacement de texte : « Catégorie:Traitement de données » par « {{Modèle:GDT}} Catégorie:Traitement de données ») |
Aucun résumé des modifications |
||
| (8 versions intermédiaires par 4 utilisateurs non affichées) | |||
| Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Le regroupement de données (clustering) est une méthode d'''[[Analyse des données|analyse des données]]'' dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division | Le regroupement de données ou groupement de données (''clustering'' en anglais) est une méthode d''''[[Analyse des données|analyse des données]]''' dans laquelle les '''[[données]]''' sont classées, par regroupement, en groupes plus homogènes, ou par division: on parle alors de partitionnement de données. Elles sont classées selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des '''[[Attrubut|attributs]]''' communs. | ||
Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’''[[ | Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l''''[[algorithme]]'''. Cette méthode d’analyse de données relève de l’'''[[apprentissage non supervisé]]'''. | ||
==Compléments== | ==Compléments== | ||
Note - Le regroupement de données (''clustering'') est la principale tâche de l’''[[Apprentissage non supervisé|apprentissage non supervisé]]'' en [[analyse des données]]. | Note - Le regroupement de données (''clustering'') est la principale tâche de l’'''[[Apprentissage non supervisé|apprentissage non supervisé]]''' en '''[[analyse des données]]'''. | ||
En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données. | En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données. | ||
| Ligne 12 : | Ligne 12 : | ||
== Français == | == Français == | ||
'''regroupement de données | '''regroupement de données''' | ||
'''groupement de données''' | '''groupement de données''' | ||
| Ligne 18 : | Ligne 18 : | ||
'''agrégation de données''' | '''agrégation de données''' | ||
'''partitionnement de données ''' | '''partitionnement de données''' | ||
'''segmentation de données | '''segmentation de données''' | ||
== Anglais == | == Anglais == | ||
'''clustering | '''clustering ''' | ||
'''data clustering | '''data clustering''' | ||
'''binning''' | '''binning''' | ||
Clustering, also known as data clustering or binning, is a method of data analysis in which data are classified, by clustering, into more homogeneous groups, or by division: this is known as data partitioning. They are classified according to a similarity measure which calculates the distance between pairs of data examples. In this way, data in the same group share common features. | |||
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26557645 | The result is group membership, or a probability of membership of each of the groups formed by the algorithm. This method of data analysis is known as unsupervised learning | ||
==Español== | |||
[[Catégorie:es]] | |||
'''''agrupamiento''''' | |||
'''''análisis de grupos''''' | |||
''La agrupación de datos, también llamada clusterización, es un método de análisis de datos mediante el cual los datos se clasifican, ya sea agrupándolos en conjuntos más homogéneos o dividiéndolos; esto se denomina partición de datos. Los datos se organizan según una medida de similitud que calcula la distancia entre pares de ejemplos. '' | |||
''Por lo tanto, los datos de un mismo grupo comparten atributos comunes.'' | |||
''El resultado es la asignación a un grupo o la probabilidad de pertenecer a cada uno de los grupos generados por el algoritmo. | |||
Este método de análisis de datos forma parte del aprendizaje no supervisado.'' | |||
==Sources== | |||
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=26557645 Source : GDT - Traitement des données ] | |||
{{Modèle:GDT}} | {{Modèle:GDT}} | ||
| Ligne 37 : | Ligne 56 : | ||
[[Catégorie:Traitement de données]] | [[Catégorie:Traitement de données]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:101]] | |||
Dernière version du 19 avril 2026 à 13:47
Définition
Le regroupement de données ou groupement de données (clustering en anglais) est une méthode d'analyse des données dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division: on parle alors de partitionnement de données. Elles sont classées selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs.
Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé.
Compléments
Note - Le regroupement de données (clustering) est la principale tâche de l’apprentissage non supervisé en analyse des données.
En Amérique du Nord, on utilise davantage le concept de regroupement (clustering) ou de création de groupes (clusters) de données, alors qu'en Europe on préfère le concept de répartition ou division en groupes (partitionnement) de données.
Français
regroupement de données
groupement de données
agrégation de données
partitionnement de données
segmentation de données
Anglais
clustering
data clustering
binning
Clustering, also known as data clustering or binning, is a method of data analysis in which data are classified, by clustering, into more homogeneous groups, or by division: this is known as data partitioning. They are classified according to a similarity measure which calculates the distance between pairs of data examples. In this way, data in the same group share common features.
The result is group membership, or a probability of membership of each of the groups formed by the algorithm. This method of data analysis is known as unsupervised learning
Español
agrupamiento
análisis de grupos
La agrupación de datos, también llamada clusterización, es un método de análisis de datos mediante el cual los datos se clasifican, ya sea agrupándolos en conjuntos más homogéneos o dividiéndolos; esto se denomina partición de datos. Los datos se organizan según una medida de similitud que calcula la distancia entre pares de ejemplos. Por lo tanto, los datos de un mismo grupo comparten atributos comunes.
El resultado es la asignación a un grupo o la probabilidad de pertenecer a cada uno de los grupos generados por el algoritmo. Este método de análisis de datos forma parte del aprendizaje no supervisado.
Sources
Contributeurs: Arianne Arel, Evan Brach, Claude Coulombe, Imane Meziani, Espanol: JSZ, wiki, Sihem Kouache





