Algorithme des k plus proches voisins


Définition

L'algorithme des k plus proches voisins est une méthode d'apprentissage automatique supervisé utilisée pour la classification et la régression afin de classer une donnée en entrée dans la catégorie à laquelle appartiennent ses k plus proches voisins dans l'espace des attributs.

Compléments

L'algorithme des k plus proches voisins est un cas particulier d'un algorithme d'apprentissage à base d'exemples ou apprentissage à base de voisinage.


Pour prédire l'étiquette associée à une donnée x (un point), la méthode des k plus proches voisins consiste à prendre en compte les k données voisines de x selon une métrique (c.-à-d. une mesure) de proximité basée sur les attributs associés à la donnée. Pour une étiquette catégorielle, l'étiquette de x sera celle de la majorité alors que pour une étiquette numérique ce sera généralement la moyenne.


L'algorithme des k plus proches voisins est non-paramétrique, c'est-à-dire que son nombre de paramètres n’est pas fixe, il est potentiellement infini et dépend de la quantité de données traitée. Aussi, le modèle n’est pas fixe et grossit avec la complexité des données.

Français

algorithme des k plus proches voisins

algorithme des KPPV

algorithme des k-PPV

algorithme des plus proches voisins

KPPV

k-PPV


Anglais

k-nearest-neighbors algorithm

k-NN algorithm

KNN algorithm

nearest neighbors algorithm

k-nearest neighbors

k-nearest neighbours

k-NN

KNN

Source: Vincent, Pascal (2003). Modèles à noyaux à structure locale, thèse de doctorat, Université de Montréal, 188 pages.

Source: Wikipédia, Méthode des k plus proches voisins.

Source: Mathieu-Dupas, Eve (2010). Algorithme des k plus proches voisins pondérés et application en diagnostic, Actes des 42èmes Journées de Statistique, Marseille, France, 8 pages.