Préparation des données


Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours du processus, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, dans le but d'en extraire des connaissances via la construction de modèles. La préparation des données est une étape clé car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.

Français

préparation des données

Anglais

data wrangling

data munging

Source: fr.wikipedia, Préparation des données.

Source: Talend.com, What is data preparation.

[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling.

Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?