Analyse de données

Cette famille de méthodes d’apprentissage permet de dégager les aspects les plus intéressants dans la nature et la structure d’un nombre très important de données. Certaines méthodes permettent de faire ressortir des relations entre les données et de décrire de façon plus succincte les principales informations qu’elles contiennent.

D’autres techniques permettent de regrouper les données de façon à faire apparaître clairement ce qui les rend homogènes. Toutes ces méthodes ont pour principales caractéristiques d’être multidimensionnelles et descriptives. On distingue les méthodes d’apprentissage non supervisé (segmentation, détection d’anomalie, clustering, etc.) des méthodes d’apprentissage supervisé (régression, classification…).

Les premières fournissent des informations sur la structure ou la distribution des données. Quant aux méthodes supervisées, elles s’intéressent aux relations et à la dépendance des variables entre elles, mettant en évidence le lien entre la variable d’intérêt et les autres variables observées.