« Nettoyage de données » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| Ligne 8 : | Ligne 8 : | ||
'''traitement des données''' | '''traitement des données''' | ||
'''curation des données''' <small>calque de l'anglais</small> | |||
==Anglais== | ==Anglais== | ||
| Ligne 15 : | Ligne 17 : | ||
'''data scrubbing''' | '''data scrubbing''' | ||
'''data curation''' | |||
'''data cooking''' <small>(familier)</small> | '''data cooking''' <small>(familier)</small> | ||
Dernière version du 28 avril 2026 à 14:45
Définition
Le nettoyage de données est l'opération de détection et de correction d'erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, de format, de syntaxe etc.
Le processus de nettoyage, ou « prétraitement des données », identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type ETL ont été les premiers à voir le jour.
Français
nettoyage de données
traitement des données
curation des données calque de l'anglais
Anglais
data cleansing
data cleaning
data scrubbing
data curation
data cooking (familier)
Sources
Source : Wikipedia, Nettoyage de données.
Source : Wikipedia, Data cleansing.
Contributeurs: Evan Brach, Imane Meziani, Jacques Barolet, Patrick Drouin, wiki





