« Préparation de données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Traitement automatisé de [[mégadonnées]] brutes qui consiste à les mettre en forme pour permettre leur analyse grâce aux méthodes de la [[science des données]].  
La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.


== Compléments ==
== Compléments ==
Le triturage de données peut inclure des changements de format, des corrections d’erreurs, des filtrages des données.
Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances et enfin la construction de modèles d'apprentissage.
 
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.  


==Français==
==Français==
'''triturage des données'''
''préparation de données''
 
''préparation de données''
 
''prétraitement de données''
 
''prétraitement de données''
 
''triturage de données''
 
''triturage des données''


==Anglais==
==Anglais==
'''data crunching'''
''data wrangling''


'''data wrangling'''
''data munging''


'''data cleaning'''
''data preprocessing''


'''data transformation'''
==Compléments vidéo==
[https://www.youtube.com/watch?v=WHUxs38XU64 Préparation des données 1 - Cours VIARENA]


'''data manipulation'''
[https://www.youtube.com/watch?v=MpNdvBmhsck Préparation des données 2 - Cours VIARENA]


==Sources==
==Sources==
[https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es  Wikipedia, Préparation des données.]
[https://fr.talend.com/resources/what-is-data-preparation/ Talend.com, What is data preparation.]
[https://en.wikipedia.org/wiki/Data_wrangling Wikipedia, Data wrangling.]
[https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ? ]
[https://datafranca.org/wiki/images/50_termes_de_l'IA-2025.pdf  ''50 termes clés de l'intelligence artificielle'', Ministère de la culture, Commission d'enrichissement de la langue française (2025). - Triturage de données]
[https://datafranca.org/wiki/images/50_termes_de_l'IA-2025.pdf  ''50 termes clés de l'intelligence artificielle'', Ministère de la culture, Commission d'enrichissement de la langue française (2025). - Triturage de données]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]
[[Catégorie:Publication]]
[[Catégorie:Publication]]

Version du 4 mars 2025 à 16:37

Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.

Compléments

Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances et enfin la construction de modèles d'apprentissage.

La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.

Français

préparation de données

préparation de données

prétraitement de données

prétraitement de données

triturage de données

triturage des données

Anglais

data wrangling

data munging

data preprocessing

Compléments vidéo

Préparation des données 1 - Cours VIARENA

Préparation des données 2 - Cours VIARENA

Sources

Wikipedia, Préparation des données.

Talend.com, What is data preparation.

Wikipedia, Data wrangling.

Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ?

50 termes clés de l'intelligence artificielle, Ministère de la culture, Commission d'enrichissement de la langue française (2025). - Triturage de données