« Préparation des données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 9 : | Ligne 9 : | ||
==Français== | ==Français== | ||
'''préparation des données''' | '''préparation des données''' | ||
'''prétraitement des données''' | |||
==Anglais== | ==Anglais== | ||
'''data wrangling''' | '''data wrangling''' | ||
'''data munging''' | '''data munging''' | ||
'''data preprocessing''' | |||
<small> | <small> |
Version du 12 août 2022 à 14:40
Définition
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement, la fusion de données et enfin le formatage.
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances, enfin la construction de modèles d'apprentissage.
La préparation des données est une étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.
Compléments
Français
préparation des données
prétraitement des données
Anglais
data wrangling
data munging
data preprocessing
Source: fr.wikipedia, Préparation des données.
Source: Talend.com, What is data preparation.
[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling.
Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?
Contributeurs: Evan Brach, Claude Coulombe, Jacques Barolet, wiki