« Représentation graphique en silhouette » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(2 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
[[Catégorie:Publication]]
==Définition==
==Définition==
En [[groupement de données]] (clustering), la représentation graphique en silhouette est une illustration  de la qualité du regroupement obtenu obtenu, qui correspond au coefficient de silhouette.
En [[groupement de données]] (clustering), la représentation graphique en silhouette est une illustration  de la qualité du regroupement obtenu obtenu, qui correspond au coefficient de silhouette.
Ligne 18 : Ligne 16 :
<!-- The silhouette plot is used to select the optimal number of clusters in K-Means clustering and also to detect cluster imbalance. This plot provides very accurate results than the Elbow plot. -->
<!-- The silhouette plot is used to select the optimal number of clusters in K-Means clustering and also to detect cluster imbalance. This plot provides very accurate results than the Elbow plot. -->


<small>
==Sources==


[https://fr.wikipedia.org/wiki/Silhouette_(clustering) Source : Wikipedia]
[https://fr.wikipedia.org/wiki/Silhouette_(clustering) Source : Wikipedia]
Ligne 24 : Ligne 22 :


[https://towardsdatascience.com/10-amazing-machine-learning-visualizations-you-should-know-in-2023-528282940582 Source : towardsdatascience]
[https://towardsdatascience.com/10-amazing-machine-learning-visualizations-you-should-know-in-2023-528282940582 Source : towardsdatascience]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 28 janvier 2024 à 13:05

Définition

En groupement de données (clustering), la représentation graphique en silhouette est une illustration de la qualité du regroupement obtenu obtenu, qui correspond au coefficient de silhouette.

Compléments

Pour chaque point de données, le coefficient de silhouette est la différence entre la distance moyenne avec les points du groupe dont il fait partie (cohésion) et la distance moyenne avec les points des autres groupes de données (séparation). Si cette différence est négative, le point est en moyenne plus proche du groupe voisin : il est donc mal classé. À l'inverse, si cette différence est positive, le point est en moyenne plus proche de son groupe que du groupe voisin : il est donc bien classé.

Le coefficient de silhouette proprement dit est la moyenne du coefficient de silhouette pour tous les points.

Français

représentation graphique en silhouette


Anglais

silhouette plot


Sources

Source : Wikipedia


Source : towardsdatascience



Contributeurs: Patrick Drouin, wiki