« Représentation graphique en silhouette » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
==Définition== | |||
== Définition == | |||
En [[groupement de données]] (clustering), la représentation graphique en silhouette est une illustration de la qualité du regroupement obtenu obtenu, qui correspond au coefficient de silhouette. | En [[groupement de données]] (clustering), la représentation graphique en silhouette est une illustration de la qualité du regroupement obtenu obtenu, qui correspond au coefficient de silhouette. | ||
== Compléments == | ==Compléments== | ||
Pour chaque point de données, le coefficient de silhouette est la différence entre la distance moyenne avec les points du groupe dont il fait partie (cohésion) et la distance moyenne avec les points des autres groupes de données (séparation). Si cette différence est négative, le point est en moyenne plus proche du groupe voisin : il est donc mal classé. À l'inverse, si cette différence est positive, le point est en moyenne plus proche de son groupe que du groupe voisin : il est donc bien classé. | Pour chaque point de données, le coefficient de silhouette est la différence entre la distance moyenne avec les points du groupe dont il fait partie (cohésion) et la distance moyenne avec les points des autres groupes de données (séparation). Si cette différence est négative, le point est en moyenne plus proche du groupe voisin : il est donc mal classé. À l'inverse, si cette différence est positive, le point est en moyenne plus proche de son groupe que du groupe voisin : il est donc bien classé. | ||
Le coefficient de silhouette proprement dit est la moyenne du coefficient de silhouette pour tous les points. | Le coefficient de silhouette proprement dit est la moyenne du coefficient de silhouette pour tous les points. | ||
== Français == | ==Français== | ||
'''représentation graphique en silhouette''' | '''représentation graphique en silhouette''' | ||
== Anglais == | ==Anglais== | ||
'''silhouette plot''' | '''silhouette plot''' | ||
Ligne 20 : | Ligne 19 : | ||
<small> | <small> | ||
[https://fr.wikipedia.org/wiki/Silhouette_(clustering) | [https://fr.wikipedia.org/wiki/Silhouette_(clustering) Source : Wikipedia] | ||
[https://towardsdatascience.com/10-amazing-machine-learning-visualizations-you-should-know-in-2023-528282940582 Source : towardsdatascience] | |||
[[Catégorie:vocabulary]] | [[Catégorie:vocabulary]][[Catégorie:Publication]] | ||
[[Catégorie:Publication]] |
Version du 15 novembre 2022 à 14:36
Définition
En groupement de données (clustering), la représentation graphique en silhouette est une illustration de la qualité du regroupement obtenu obtenu, qui correspond au coefficient de silhouette.
Compléments
Pour chaque point de données, le coefficient de silhouette est la différence entre la distance moyenne avec les points du groupe dont il fait partie (cohésion) et la distance moyenne avec les points des autres groupes de données (séparation). Si cette différence est négative, le point est en moyenne plus proche du groupe voisin : il est donc mal classé. À l'inverse, si cette différence est positive, le point est en moyenne plus proche de son groupe que du groupe voisin : il est donc bien classé.
Le coefficient de silhouette proprement dit est la moyenne du coefficient de silhouette pour tous les points.
Français
représentation graphique en silhouette
Anglais
silhouette plot
Contributeurs: Patrick Drouin, wiki