« Préparation des données » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
[[Catégorie:]] | [[Catégorie:]] | ||
==Définition== | ==Définition== | ||
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours | La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement ou encore la fusion de données. Au cours du processus, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[exploration de données]]''', au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles. | ||
La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données. | La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données. | ||
Ligne 23 : | Ligne 23 : | ||
<small> | <small> | ||
[https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es | [https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es Source: fr.wikipedia, Préparation des données.] | ||
[https://fr.talend.com/resources/what-is-data-preparation/ | [https://fr.talend.com/resources/what-is-data-preparation/ Source: Talend.com, What is data préparation.] | ||
[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling. | [https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling. | ||
[https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling/ | [https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling/ Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?] |
Version du 26 avril 2020 à 14:50
[[Catégorie:]]
Définition
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours du processus, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles.
La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données.
La préparation des données, est le processus de transformation et de mise en correspondance des données d'une forme de données "brutes" dans un autre format, dans le but de les rendre plus appropriées et plus utiles à diverses fins en aval, telles que l'analyse. Un "data wrangler" est une personne qui effectue ces opérations de transformation.
Il peut s'agir d'un (nettoyage) supplémentaire, d'une visualisation des données, d'une agrégation de données, de la formation d'un modèle statistique, ainsi que de nombreuses autres utilisations potentielles. Le "munging" des données en tant que processus suit généralement un ensemble d'étapes générales qui commencent par l'extraction des données sous forme brute à partir de la source de données, le "munging" des données brutes à l'aide d'algorithmes (par exemple le tri) ou l'analyse des données en structures de données prédéfinies, et enfin le dépôt du contenu résultant dans un puits de données pour le stockage et l'utilisation future.
Français
préparation des données loc. nom. fém.
Anglais
data wrangling
data munging
Source: fr.wikipedia, Préparation des données.
Source: Talend.com, What is data préparation.
[https://en.wikipedia.org/wiki/Data_wrangling Source: en.wikipedia, Data wrangling.
Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?
Contributeurs: Evan Brach, Claude Coulombe, Jacques Barolet, wiki