« Préparation des données » : différence entre les versions


(Page créée avec « Catégorie:scotty Catégorie:9 ==Définition== La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de pl... »)
Balise : Éditeur de wikicode 2017
 
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :
[[Catégorie:scotty]]
[[Catégorie:scotty]]
[[Catégorie:9]]
[[Catégorie:]]
 
==Définition==
==Définition==
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours de la préparation des données, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles.
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours de la préparation des données, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles.

Version du 26 avril 2020 à 15:48

[[Catégorie:]]

Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours de la préparation des données, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles.

La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données.


La préparation des données, est le processus de transformation et de mise en correspondance des données d'une forme de données "brutes" dans un autre format, dans le but de les rendre plus appropriées et plus utiles à diverses fins en aval, telles que l'analyse. Un "data wrangler" est une personne qui effectue ces opérations de transformation.

Il peut s'agir d'un (nettoyage) supplémentaire, d'une visualisation des données, d'une agrégation de données, de la formation d'un modèle statistique, ainsi que de nombreuses autres utilisations potentielles. Le "munging" des données en tant que processus suit généralement un ensemble d'étapes générales qui commencent par l'extraction des données sous forme brute à partir de la source de données, le "munging" des données brutes à l'aide d'algorithmes (par exemple le tri) ou l'analyse des données en structures de données prédéfinies, et enfin le dépôt du contenu résultant dans un puits de données pour le stockage et l'utilisation future.

Français

préparation des données loc. nom. fém.


Anglais

data wrangling

data munging


Source: fr.wikipedia, Préparation des données.

Source: Talend.com, What is data préparation.

[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling.

Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?