« K-moyennes » : différence entre les versions


Aucun résumé des modifications
 
(35 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
__NOTOC__
==Définition==
== Domaine ==
Un '''[[algorithme]]''' de [[Regroupement de données|'''partitionnement de données''']] (''clustering'') populaire qui regroupe des exemples dans l''''[[apprentissage non supervisé]]'''. L'algorithme k-moyennes effectue les opérations suivantes :
[[Category:Vocabulaire]]
* Détermination de manière itérative des meilleurs k points centraux (appelés centroïdes).
[[Category:Google]]
* Assignation de chaque exemple au centroïde le plus proche.
[[Category:Apprentissage profond]]
Les exemples les plus proches du même centroïde font partie du même groupe ou '''grappe'''. L'algorithme k-moyennes choisit l'emplacement des centroïdes de manière à minimiser le carré cumulatif des distances entre chaque exemple et son centroïde le plus proche.
[[Category:scotty]]
<br />
<br />


== Définition ==
==Français==
Un algorithme de partitionnement (''clustering'') populaire qui regroupe des exemples dans l'apprentissage non supervisé. L'algorithme k-moyennes effectue les opérations suivantes :
'''k-moyennes'''  


Détermination de manière itérative des meilleurs k points centraux (appelés centroïdes).
'''algorithme des k-moyennes'''
Assignation de chaque exemple au centroïde le plus proche. Les exemples les plus proches du même centroïde font partie du même groupe.
L'algorithme k-moyennes choisit l'emplacement des centroïdes de manière à minimiser le carré cumulatif des distances entre chaque exemple et son centroïde le plus proche.


Supposons le graphe suivant représentant la taille de chiens en fonction de leur largeur :
==Anglais==
'''k-means'''


[[Fichier:Kmoyenne1.jpg]]
==Sources==


Si k = 3, l'algorithme k-moyennes détermine trois centroïdes. Chaque exemple est assigné à son centroïde le plus proche, ce qui donne trois groupes :
[https://developers.google.com/machine-learning/glossary  Source : Google, ''Machine learning glossary''.]


[[Fichier:Kmoyenne2.jpg]]
[https://fr.wikipedia.org/wiki/K-moyennes  Source : Wikipedia, ''K-moyennes''.]


Imaginez qu'un fabricant souhaite déterminer les tailles idéales de tricots pour chien petits, moyens et grands. Les trois centroïdes identifient la hauteur et la largeur moyennes de chaque chien du cluster correspondant. Ainsi, le fabricant devrait probablement baser les tailles de pull sur ces trois centroïdes. Notez que le centroïde d'un cluster n'est généralement pas un exemple du cluster.
[[Category:GRAND LEXIQUE FRANÇAIS]]
 
[[Catégorie:Apprentissage automatique]]
Les illustrations précédentes montrent les k-moyennes pour des exemples avec seulement deux caractéristiques (hauteur et largeur). Notez que les k-moyennes peuvent regrouper des exemples pour de nombreuses caractéristiques.
<br />
<br />
 
== Français ==
=== k-moyennes ===
<br />
<br />
 
== Anglais ==
=== k-means  ===
 
<br/>
<br/>
<br/>
 
<br/>
<br/>
<br/>
<br/>

Dernière version du 6 février 2024 à 13:10

Définition

Un algorithme de partitionnement de données (clustering) populaire qui regroupe des exemples dans l'apprentissage non supervisé. L'algorithme k-moyennes effectue les opérations suivantes :

  • Détermination de manière itérative des meilleurs k points centraux (appelés centroïdes).
  • Assignation de chaque exemple au centroïde le plus proche.

Les exemples les plus proches du même centroïde font partie du même groupe ou grappe. L'algorithme k-moyennes choisit l'emplacement des centroïdes de manière à minimiser le carré cumulatif des distances entre chaque exemple et son centroïde le plus proche.

Français

k-moyennes

algorithme des k-moyennes

Anglais

k-means

Sources

Source : Google, Machine learning glossary.

Source : Wikipedia, K-moyennes.