Analyse en composantes principales


Définition

Formellement, l'analyse en composantes principales (ACP) est une technique statistique de réduction de la dimensionnalité d'un jeu de données. Ceci est accompli en transformant linéairement les données en un nouveau système de coordonnées où la plus grande partie de la variation des données peut être décrite avec moins de dimensions que les données initiales.

Compléments

L'ACP a été mise au point par Karl Pearson au début du 20e siècle, et dont on peut retracer l’origine dans des travaux remontant au 19e siècle, par laquelle on transforme des données comportant un grand nombre de variables en un ensemble portant sur un nombre plus restreint de variables indépendantes les unes des autres, donc plus facile à traiter.

L'analyse en composantes principales a des applications dans de nombreux domaines tels que la génétique des populations, les études du microbiome et les sciences de l'atmosphère. Cette méthode est utilisée notamment dans le traitement d’images et dans le traitement de données sociales, pour faire ressortir les éléments les plus importants de ces données.

L'analyse en composantes principales (ACP) est une technique populaire pour analyser de grands ensembles de données contenant un nombre élevé de dimensions/attributs par observation, augmentant l'interprétabilité des données tout en préservant un maximum d'information et facilitant la visualisation de données multidimensionnelles (diagramme des composantes principales).

Français

analyse en composantes principales

ACP

Anglais

principal component analysis

PCA

Sources

Source: Lavery.ca

Source : Statistica

Source: Wikipedia