Nettoyage de données
Définition
En apprentissage automatique, processus de détection et de correction d'enregistrements corrompus ou inexacts d'un jeu de données brutes, d'une table ou d'une base de données. Il fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter au moment d'élaborer des algorithmes.
Français
nettoyage des données loc. nom. masc.
Anglais
Data cleansing
Data cleaning
Data Cooking (familier)
Contributeurs: Evan Brach, Imane Meziani, Jacques Barolet, wiki