« Nettoyage de données » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 2 : Ligne 2 :


==Définition==
==Définition==
En apprentissage automatique, phase qui consiste à supprimer les données incohérentes, corriger les erreurs comme, par exemple, des données mal saisies. Disposer d’informations d’un bon niveau de qualité est un préalable à l’élaboration d’algorithmes.  
En apprentissage automatique, processus de détection et de correction d'enregistrements corrompus ou inexacts d'un jeu de données brutes, d'une table ou d'une base de données et fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter au moment d'élaborer des algorithmes.


==Français==
==Français==
Ligne 9 : Ligne 9 :
==Anglais==
==Anglais==
''' Data cleansing'''
''' Data cleansing'''
''' Data cleaning'''
''' Data Cooking'''  (familier)





Version du 21 avril 2020 à 15:23


Définition

En apprentissage automatique, processus de détection et de correction d'enregistrements corrompus ou inexacts d'un jeu de données brutes, d'une table ou d'une base de données et fait référence à l'identification de parties incomplètes, incorrectes, inexactes ou non pertinentes des données, puis au remplacement, à la modification, ou la suppression les données incohérentes ou de formats hétéroclites. Une fois traitées, ces données peuvent être stockées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter au moment d'élaborer des algorithmes.

Français

nettoyage des données loc. nom. masc.

Anglais

Data cleansing

Data cleaning

Data Cooking (familier)


Source: Catalix, Data cleansing.