« Nettoyage de données » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 4 : Ligne 4 :
ajout de redirections
ajout de redirections
==Définition==
==Définition==
Le nettoyage de données est l'opération de détection et de correction d'erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, de format, de syntaxe etc. Le processus de nettoyage, aussi appelé « prétraitement des données » identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type ETL ont été les premiers à voir le jour.
Le nettoyage de données est l'opération de détection et de correction d'erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, de format, de syntaxe etc. Le processus de nettoyage, aussi appelé « prétraitement des données » identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type '''[[ETL]]''' ont été les premiers à voir le jour.


==Français==
==Français==

Version du 21 avril 2020 à 17:52

ajout de redirections

Définition

Le nettoyage de données est l'opération de détection et de correction d'erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, de format, de syntaxe etc. Le processus de nettoyage, aussi appelé « prétraitement des données » identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type ETL ont été les premiers à voir le jour.

Français

nettoyage de données loc. nom. masc.

prétraitement des données (1) loc. nom. masc.

Anglais

Data cleansing

Data cleaning

Data scrubbing

Data Cooking (familier)


Source: fr.wikipedia, Nettoyage de données.

Source: en.wikipedia, Data cleansing.

(1) Source: Christion Gagné, Université Laval, Prétraitement et analyse de données, Introduction à l'apprentissage machine, Université Laval, 2018.

Source: Techopedia, Cooked Data.