« Nettoyage de données » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


==Définition==
==Définition==
En apprentissage automatique, prétraitement préalable pour détecter et corriger des enregistrements corrompus ou incohérents d'un jeu de données brutes, d'une table ou d'une base de données. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes.
 
 
 
 
 
En apprentissage automatique et en entreposage des données, prétraitement préalable d'un jeu de données brutes  pour en détecter et en corriger des enregistrements corrompus ou incohérents. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes.
 
Les nettoyeurs de type  ETL ont été les premiers à voir le jour.


==Français==
==Français==
Ligne 20 : Ligne 27 :
<small>
<small>


[https://en.wikipedia.org/wiki/Data_cleansing Source: en.wikipedia, ''Data cleansing''.]
[https://en.wikipedia.org/wiki/Data_cleansing Source: en.wikipedia, ''Data cleansing''.]


<sup>(1)</sup> [http://vision.gel.ulaval.ca/~cgagne/enseignement/apprentissage/A2018/presentations/iam-sem13-analyse.pdf Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.]
<sup>(1)</sup> [http://vision.gel.ulaval.ca/~cgagne/enseignement/apprentissage/A2018/presentations/iam-sem13-analyse.pdf Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.]


[https://www.techopedia.com/definition/14676/cooked-data Source: Techopedia, ''Cooked Data''.]
[https://www.techopedia.com/definition/14676/cooked-data Source: Techopedia, ''Cooked Data''.]

Version du 21 avril 2020 à 15:14


Définition

En apprentissage automatique et en entreposage des données, prétraitement préalable d'un jeu de données brutes pour en détecter et en corriger des enregistrements corrompus ou incohérents. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes.

Les nettoyeurs de type ETL ont été les premiers à voir le jour.

Français

nettoyage de données loc. nom. masc.

(1) prétraitement de données loc. nom. masc.

Anglais

Data cleansing

Data cleaning

Data Cooking (familier)


Source: en.wikipedia, Data cleansing.

(1) Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.

Source: Techopedia, Cooked Data.