« Préparation de données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage. | La préparation de données est un processus qui précède celui de l'[[analyse de données]]. Il est constitué de plusieurs tâches comme la collecte, le [[Nettoyage des données|nettoyage]], l'enrichissement incluant l'[[Annotation des données|annotation]], la fusion de données et enfin le formatage. | ||
== Compléments == | == Compléments == | ||
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances et enfin la construction de modèles d'apprentissage. | Au cours du processus, les données « [[Données brutes|brutes]] » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'[[exploration des données]], puis celle de [[Forage de données|forage]] dans le but d'en extraire des connaissances et enfin la construction de [[Modèle|modèles d'apprentissage]]. | ||
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données. | La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données. |
Dernière version du 13 mars 2025 à 11:58
Définition
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.
Compléments
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances et enfin la construction de modèles d'apprentissage.
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.
Cette étape de préparation correspond au T dans l'acronyme ETC (extraction transformation chargement).
Bien que certains suggèrent l'équivalent data crunching, nous suggérons plutôt d'utiliser traitement de données pour ce dernier concept.
Français
préparation de données
préparation des données
prétraitement de données
prétraitement des données
triturage de données
triturage des données
Anglais
data wrangling
data munging
data preprocessing
Compléments vidéo
Préparation des données 1 - Cours VIARENA
Préparation des données 2 - Cours VIARENA
Sources
Wikipedia, Préparation des données.
Talend.com, What is data preparation.
Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ?
Contributeurs: Arianne , Claude Coulombe, Patrick Drouin, wiki