Nettoyage de données
Définition
En apprentissage automatique et en entreposage des données, prétraitement préalable d'un jeu de données brutes pour en détecter et en corriger des enregistrements corrompus ou incohérents. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter, notamment au moment d'élaborer des algorithmes.
Les nettoyeurs de type ETL ont été les premiers à voir le jour.
Français
nettoyage de données loc. nom. masc.
(1) prétraitement de données loc. nom. masc.
Anglais
Data cleansing
Data cleaning
Data Cooking (familier)
Contributeurs: Evan Brach, Imane Meziani, Jacques Barolet, wiki