« Partitionnement de données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 8 : Ligne 8 :


==Définition==
==Définition==
Groupement d'exemples similaires, en particulier lors d'un apprentissage non supervisé. Une fois l'agrégation de modèles complétée, une personne peut éventuellement attribuer un sens à chaque partitionnement.
Le '''partitionnement de données''' est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
 
Il existe de nombreux algorithmes de partitionnement. Par exemple, l'algorithme '''k-moyennes''' groupe des exemples en fonction de leur proximité avec un centroïde


==Français==
==Français==
Ligne 22 : Ligne 20 :


==Anglais==
==Anglais==
'''clustering'''
'''data clustering'''





Version du 28 février 2020 à 20:01


Définition

Le partitionnement de données est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.

Français

partitionnement des données loc. nom. masc,

agrégation de modèles loc. nom. fém,

mise en grappe loc. nom. fém,


Anglais

data clustering



Source: Wikipedia IA

source : dataanalyticspost.com

source : WikiStat