« Préparation des données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :
[[Catégorie:]]
[[Catégorie:]]
==Définition==
==Définition==
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement ou encore la fusion de données. Au cours du processus, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[exploration de données]]''', au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles.
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement ou encore la fusion de données. Au cours du processus, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[exploration de données]]''', dans le but d'en extraire des connaissances via la construction de modèles. La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données.
 
La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données.
 
 
La préparation des données, est le processus de transformation et de mise en correspondance des données d'une forme de données "brutes" dans un autre format, dans le but de les rendre plus appropriées et plus utiles à diverses fins en aval, telles que l'analyse. Un "data wrangler" est une personne qui effectue ces opérations de transformation.
 
Il peut s'agir d'un (nettoyage)  supplémentaire, d'une visualisation des données, d'une agrégation de données, de la formation d'un modèle statistique, ainsi que de nombreuses autres utilisations potentielles. Le "munging" des données en tant que processus suit généralement un ensemble d'étapes générales qui commencent par l'extraction des données sous forme brute à partir de la source de données, le "munging" des données brutes à l'aide d'algorithmes (par exemple le tri) ou l'analyse des données en structures de données prédéfinies, et enfin le dépôt du contenu résultant dans un puits de données pour le stockage et l'utilisation future.


==Français==
==Français==
préparation des données  loc. nom. fém.
'''préparation des données'''   <small>loc. nom. fém.</small>
 
   
   
==Anglais==
==Anglais==

Version du 26 avril 2020 à 16:02

[[Catégorie:]]

Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours du processus, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, dans le but d'en extraire des connaissances via la construction de modèles. La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données.

Français

préparation des données loc. nom. fém.

Anglais

data wrangling

data munging


Source: fr.wikipedia, Préparation des données.

Source: Talend.com, What is data préparation.

[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling.

Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?