« Préparation des données » : différence entre les versions


m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
La préparation de données est un processus qui précède celui de l'[[Analyse des données|analyse de données]]. Il est constitué de plusieurs tâches comme la collecte, le [[Nettoyage des données|nettoyage]], l'enrichissement incluant l'[[Annotation des données|annotation]], la fusion de données et enfin le formatage.  
La préparation de données est un processus qui précède celui de l''''[[Analyse des données|analyse de données]]'''. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement incluant l''''[[Annotation des données|annotation]]''', la fusion de données et enfin le formatage.  


Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'[[exploration des données]], puis celle de [[Forage de données|forage]] dans le but d'en extraire des connaissances, enfin la construction de [[Modèle|modèles d'apprentissage]].
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[exploration des données]]''', puis celle de '''[[Forage de données|forage]]''' dans le but d'en extraire des connaissances, enfin la construction de '''[[Modèle|modèles d'apprentissage]]'''.


La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.

Version du 28 janvier 2024 à 22:09

Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.

Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances, enfin la construction de modèles d'apprentissage.

La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.

Compléments

Français

préparation des données

prétraitement des données

Anglais

data wrangling

data munging

data preprocessing

Sources

Source: fr.wikipedia, Préparation des données.

Source: Talend.com, What is data preparation.

[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling.

Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?


Compléments vidéos