Exploration de données


Définition

L’Analyse de données débute généralement par l'exploration et la visualisation des données. L'exploration de données (ou analyse exploratoire de données) cherche à se familiariser, à mieux comprendre, à évaluer des statistiques de base, à identifier des régularités, des formes (patterns), ou des liens potentiels, à détecter d'éventuelles anomalies comme les données aberrantes (outliers). À cette étape, on regardera les premiers exemples de données, les derniers exemples, on échantillonnera des exemples au hasard.

L’exploration de données est une analyse préliminaire où l’on explore, on cherche à confirmer des intuitions, à faire émerger des concepts.

Terme lié : Analyse de données

Compléments

De ou des données?

Bien que l'on rencontre la forme exploration des données, nous recommandons l’utilisation le terme exploration de données puisque les données ne sont pas bien identifiées, il s’agit donc d’une référence à un générique. Avec un jeu de données spécifique (bien déterminé), on peut alors procéder à l'exploration des données qu’il contient. Dans l'usage courant, les deux formes sont équivalentes et interchangeables.

Français

exploration de données

exploration des données

analyse exploratoire de données

analyse exploratoire des données

AED

analyse préliminaire de données

analyse préliminaire des données

prospection de données

prospection des données

Anglais

exploratory data analysis

EDA

Source : Monique Le Guen. L’AED et SAS/INSIGHT, Visualisations dynamiques des données. 2004, pp.1-13. ffhalshs-00288575

Source : Wikipédia

Source : ISI

© Glossaire de la statistique DataFranca