« Préparation des données » : différence entre les versions


(Page créée avec « Catégorie:scotty Catégorie:9 ==Définition== La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de pl... »)
Balise : Éditeur de wikicode 2017
 
Aucun résumé des modifications
 
(35 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
[[Catégorie:scotty]]
[[Catégorie:9]]
==Définition==
==Définition==
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement ou encore la fusion de données. Au cours de la préparation des données, les données dites « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration de données, au cours de laquelle le but sera d'extraire des connaissances à partir des données via la construction de modèles.
La préparation de données est un processus qui précède celui de l''''[[Analyse des données|analyse de données]]'''. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement incluant l''''[[Annotation des données|annotation]]''', la fusion de données et enfin le formatage.  
 
La préparation des données une étape clé car la fiabilité de l'analyse des données dépend en très grande partie de la qualité des données.
 


La préparation des données, est le processus de transformation et de mise en correspondance des données d'une forme de données "brutes" dans un autre format, dans le but de les rendre plus appropriées et plus utiles à diverses fins en aval, telles que l'analyse. Un "data wrangler" est une personne qui effectue ces opérations de transformation.
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[exploration des données]]''', puis celle de '''[[Forage de données|forage]]''' dans le but d'en extraire des connaissances, enfin la construction de '''[[Modèle|modèles d'apprentissage]]'''.


Il peut s'agir d'un (nettoyage)  supplémentaire, d'une visualisation des données, d'une agrégation de données, de la formation d'un modèle statistique, ainsi que de nombreuses autres utilisations potentielles. Le "munging" des données en tant que processus suit généralement un ensemble d'étapes générales qui commencent par l'extraction des données sous forme brute à partir de la source de données, le "munging" des données brutes à l'aide d'algorithmes (par exemple le tri) ou l'analyse des données en structures de données prédéfinies, et enfin le dépôt du contenu résultant dans un puits de données pour le stockage et l'utilisation future.
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.


==Français==
==Français==
préparation des données   loc. nom. fém.
'''préparation des données''' 


'''prétraitement des données'''
   
   
==Anglais==
==Anglais==
data wrangling
'''data wrangling'''
 
'''data munging'''
 
'''data preprocessing'''
 
==Sources==
 
[https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es  Source : Wikipedia, ''Préparation des données''.]
 
[https://fr.talend.com/resources/what-is-data-preparation/ Source : Talend.com, ''What is data preparation''.]


data munging  
[https://en.wikipedia.org/wiki/Data_wrangling  Source : Wikipedia, ''Data wrangling''.]  


[https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling  Source : Trifacta.com, Victor Coustenoble, ''Qu’est ce que le Data Wrangling ?'']


<small>
<div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;">
===Compléments vidéos===


[https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es  Source:  fr.wikipedia, Préparation des données]
*[https://www.youtube.com/watch?v=WHUxs38XU64 Préparation des données 1 - Cours VIARENA]


[https://fr.talend.com/resources/what-is-data-preparation/  Source: Talend.com, What is data préparation. ]
*[https://www.youtube.com/watch?v=MpNdvBmhsck Préparation des données 2 - Cours VIARENA]


[https://en.wikipedia.org/wiki/Data_wrangling  Source: en.wikipedia, Data wrangling.
<br></div>


[https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling/  Source: Victor Coustenoble, Trifacta.com, Qu’est ce que le Data Wrangling ?]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 8 février 2024 à 18:02

Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.

Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances, enfin la construction de modèles d'apprentissage.

La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.

Français

préparation des données

prétraitement des données

Anglais

data wrangling

data munging

data preprocessing

Sources

Source : Wikipedia, Préparation des données.

Source : Talend.com, What is data preparation.

Source : Wikipedia, Data wrangling.

Source : Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ?

Compléments vidéos