« Regroupement de données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Le groupement des données est une méthode d'[https://datafranca.org/wiki/Analyse_des_donn%C3%A9es analyse des données]dans laquelle les données sont classées, par division (on parle alors de [https://datafranca.org/wiki/Partitionnement_de_donn%C3%A9es partitionnement des données]ou par regroupement, en groupes plus homogènes selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un groupe partagent des attributs communs. | Le groupement des données est une méthode d'[https://datafranca.org/wiki/Analyse_des_donn%C3%A9es analyse des données]dans laquelle les données sont classées, par division (on parle alors de [https://datafranca.org/wiki/Partitionnement_de_donn%C3%A9es partitionnement des données)]ou par regroupement, en groupes plus homogènes selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs. | ||
Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé . | Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé . | ||
==Compléments== | ==Compléments== | ||
Note - Le groupement de données est la principale tâche de l’[https://datafranca.org/wiki/Apprentissage_non_supervis%C3%A9 apprentissage non supervisé] en [https://datafranca.org/wiki/Analyse_des_donn%C3%A9es analyse des données.] | Note - Le groupement de données (clustering) est la principale tâche de l’[https://datafranca.org/wiki/Apprentissage_non_supervis%C3%A9 apprentissage non supervisé] en [https://datafranca.org/wiki/Analyse_des_donn%C3%A9es analyse des données.] | ||
== Français == | == Français == |
Version du 8 août 2022 à 17:39
Définition
Le groupement des données est une méthode d'analyse des donnéesdans laquelle les données sont classées, par division (on parle alors de partitionnement des données)ou par regroupement, en groupes plus homogènes selon une mesure de similarité qui calcule la distance entre paires d'exemples de données. Ainsi les données d’un même groupe partagent des attributs communs.
Le résultat est l'appartenance à un groupe ou une probabilité d'appartenance à chacun des groupes formés par l'algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé .
Compléments
Note - Le groupement de données (clustering) est la principale tâche de l’apprentissage non supervisé en analyse des données.
Français
groupement de données
partitionnement de données
regroupement de données
segmentation de données
Anglais
clustering
data clustering
binning
Contributeurs: Evan Brach, Claude Coulombe, Imane Meziani, wiki, Sihem Kouache