« Nettoyage de données » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
 
(30 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
==Définition==
Le nettoyage de données est l'opération de détection et de correction d'erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, de format, de syntaxe etc.


==Définition==
Le processus de nettoyage, ou « prétraitement des données », identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type '''[[ETL]]''' ont été les premiers à voir le jour.
En apprentissage automatique, prétraitement préalable pour détecter et corriger des enregistrements corrompus ou incohérents d'un jeu de données brutes, d'une table ou d'une base de données. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes.


==Français==
==Français==
'''nettoyage de données'''  <small>loc. nom. masc.</small>
'''nettoyage de données'''   
 
'''traitement des données'''


<sup>(1)</sup> '''prétraitement de données'''    <small>loc. nom. masc.</small>
==Anglais==
==Anglais==
''' Data cleansing'''
'''data cleansing'''
 
'''data cleaning'''
 
'''data scrubbing'''


''' Data cleaning'''
'''data cooking'''   <small>(familier)</small>


''' Data Cooking'''  (familier)
==Sources==


[https://fr.wikipedia.org/wiki/Nettoyage_de_donn%C3%A9es  Source : Wikipedia, ''Nettoyage de données''.]


[https://en.wikipedia.org/wiki/Data_cleansing  Source : Wikipedia, ''Data cleansing''.]


<small>
[https://www.techopedia.com/definition/14676/cooked-data  Source : Techopedia, ''Cooked Data''.]


[https://catalix.net/glossaire-intelligence-artificielle/ Source: Catalix, ''Data cleansing''.]
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8873874  Source : GDT - Traitement des données ]
 
 
 
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
{{Modèle:GDT}}


<sup>(1)</sup> [http://vision.gel.ulaval.ca/~cgagne/enseignement/apprentissage/A2018/presentations/iam-sem13-analyse.pdf  Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.]
[[Catégorie:Traitement de données]]

Dernière version du 18 février 2024 à 00:22

Définition

Le nettoyage de données est l'opération de détection et de correction d'erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, de format, de syntaxe etc.

Le processus de nettoyage, ou « prétraitement des données », identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type ETL ont été les premiers à voir le jour.

Français

nettoyage de données

traitement des données

Anglais

data cleansing

data cleaning

data scrubbing

data cooking (familier)

Sources

Source : Wikipedia, Nettoyage de données.

Source : Wikipedia, Data cleansing.

Source : Techopedia, Cooked Data.

Source : GDT - Traitement des données


GRAND DICTIONAIRE TERMINOLOGIQUE
Source : Ce terme provient de La Vitrine linguistiquede l'Office québécois de la langue française.