« Nettoyage de données » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
==Définition== | ==Définition== | ||
En apprentissage automatique, prétraitement préalable pour détecter et corriger des enregistrements corrompus ou incohérents | |||
En apprentissage automatique et en entreposage des données, prétraitement préalable d'un jeu de données brutes pour en détecter et en corriger des enregistrements corrompus ou incohérents. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes. | |||
Les nettoyeurs de type ETL ont été les premiers à voir le jour. | |||
==Français== | ==Français== | ||
Ligne 20 : | Ligne 27 : | ||
<small> | <small> | ||
[https://en.wikipedia.org/wiki/Data_cleansing | [https://en.wikipedia.org/wiki/Data_cleansing Source: en.wikipedia, ''Data cleansing''.] | ||
<sup>(1)</sup> [http://vision.gel.ulaval.ca/~cgagne/enseignement/apprentissage/A2018/presentations/iam-sem13-analyse.pdf Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.] | <sup>(1)</sup> [http://vision.gel.ulaval.ca/~cgagne/enseignement/apprentissage/A2018/presentations/iam-sem13-analyse.pdf Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.] | ||
[https://www.techopedia.com/definition/14676/cooked-data | [https://www.techopedia.com/definition/14676/cooked-data Source: Techopedia, ''Cooked Data''.] |
Version du 21 avril 2020 à 15:14
Définition
En apprentissage automatique et en entreposage des données, prétraitement préalable d'un jeu de données brutes pour en détecter et en corriger des enregistrements corrompus ou incohérents. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes.
Les nettoyeurs de type ETL ont été les premiers à voir le jour.
Français
nettoyage de données loc. nom. masc.
(1) prétraitement de données loc. nom. masc.
Anglais
Data cleansing
Data cleaning
Data Cooking (familier)
Contributeurs: Evan Brach, Imane Meziani, Jacques Barolet, wiki