« Partitionnement de données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Le partitionnement de données est une méthode de classification non supervisée en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » ou « grappes » homogènes, en ce sens que les données de chaque sous-ensemble partagent des '''[[caractéristiques]]''' communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et '''[[Classe|classes]]''' de distance entre objets.
Le groupement des données est une méthode d’[[analyse des données]] dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de [[Partitionnement de données|partitionnement des données)]] selon une mesure de similarité qui calcule la distance entre paires d’exemples de données. Ainsi, les données d’un même groupe partagent des attributs communs.
 
Le résultat est l’appartenance à un groupe ou une probabilité d’appartenance à chacun des groupes formés par l’algorithme. Cette méthode d’analyse de données relève de l’[[apprentissage non supervisé]].


Voir : '''[[Analyse par groupe]]'''  et '''[[Groupement de données]]'''
Voir : '''[[Analyse par groupe]]'''  et '''[[Groupement de données]]'''
Ligne 30 : Ligne 32 :
</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html>  
</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html>  
<br></div><br><br>
<br></div><br><br>


[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Category:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]
[[Catégorie:101]]

Version du 22 août 2022 à 09:10

Définition

Le groupement des données est une méthode d’analyse des données dans laquelle les données sont classées, par regroupement, en groupes plus homogènes, ou par division (on parle alors de partitionnement des données) selon une mesure de similarité qui calcule la distance entre paires d’exemples de données. Ainsi, les données d’un même groupe partagent des attributs communs.

Le résultat est l’appartenance à un groupe ou une probabilité d’appartenance à chacun des groupes formés par l’algorithme. Cette méthode d’analyse de données relève de l’apprentissage non supervisé.

Voir : Analyse par groupe et Groupement de données

Français

partitionnement des données

agrégation de modèles

mise en grappe

groupement des données

regroupement des données

Anglais

data clustering


Source: Wikipedia, Partitionnement de données .

Source: dataanalytics, Clustering.

Source: Université de Toulouse, WikiStat, Agrégation de modèles.