« Préparation des données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(12 versions intermédiaires par 3 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
La préparation de données est un processus qui précède celui de l''''[[Analyse des données|analyse de données]]'''. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement, la fusion de données et enfin le formatage. | La préparation de données est un processus qui précède celui de l''''[[Analyse des données|analyse de données]]'''. Il est constitué de plusieurs tâches comme la collecte, le '''[[Nettoyage des données|nettoyage]]''', l'enrichissement incluant l''''[[Annotation des données|annotation]]''', la fusion de données et enfin le formatage. | ||
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[ | Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d''''[[exploration des données]]''', puis celle de '''[[Forage de données|forage]]''' dans le but d'en extraire des connaissances, enfin la construction de '''[[Modèle|modèles d'apprentissage]]'''. | ||
La préparation des données est | La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données. | ||
==Français== | ==Français== | ||
Ligne 20 : | Ligne 18 : | ||
'''data preprocessing''' | '''data preprocessing''' | ||
==Sources== | |||
[https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es Source : Wikipedia, ''Préparation des données''.] | |||
[https://fr.talend.com/resources/what-is-data-preparation/ Source : Talend.com, ''What is data preparation''.] | |||
[https://en.wikipedia.org/wiki/Data_wrangling Source : Wikipedia, ''Data wrangling''.] | |||
[https:// | [https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling Source : Trifacta.com, Victor Coustenoble, ''Qu’est ce que le Data Wrangling ?''] | ||
<div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"> | |||
===Compléments vidéos=== | |||
[https:// | *[https://www.youtube.com/watch?v=WHUxs38XU64 Préparation des données 1 - Cours VIARENA] | ||
[https://www. | *[https://www.youtube.com/watch?v=MpNdvBmhsck Préparation des données 2 - Cours VIARENA] | ||
<br></div> | |||
<br></div | |||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:101]] | [[Catégorie:101]] |
Dernière version du 8 février 2024 à 17:02
Définition
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances, enfin la construction de modèles d'apprentissage.
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.
Français
préparation des données
prétraitement des données
Anglais
data wrangling
data munging
data preprocessing
Sources
Source : Wikipedia, Préparation des données.
Source : Talend.com, What is data preparation.
Source : Wikipedia, Data wrangling.
Source : Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ?
Contributeurs: Evan Brach, Claude Coulombe, Jacques Barolet, wiki