« Données sales » : différence entre les versions


m (Remplacement de texte — « Catégorie:ISI Catégorie:Statistiques » par « Catégorie:ISI »)
m (Remplacement de texte : « Catégorie:GRAND LEXIQUE FRANÇAIS » par «  »)
 
(11 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Les données sales sont des données inexactes, incomplètes ou incohérentes, notamment dans un système informatique ou une base de données.
Les données sales peuvent contenir des erreurs telles que des fautes d'orthographe ou de ponctuation, des données incorrectes associées à un champ, des données incomplètes ou périmées, voire des données qui ont été dupliquées dans la base de données. Elles peuvent être nettoyées grâce à un processus connu sous le nom de [[nettoyage de données]].
== Français ==
== Français ==
'''données sales'''
'''données sales'''
Ligne 6 : Ligne 10 :
''' dirty data'''
''' dirty data'''


<small>
==Sources==
 
[https://www.isi-web.org/glossary?language=2  Source : ISI Glossaire ]
 
[https://isi.cbs.nl/glossary/term959.htm  Source : ISI ]
 
[https://definir-tech.com/donnees-sales/  Source : Definir-tech ]


[http://isi.cbs.nl/glossary/term959.htm Source : ISI ]
[https://en.wikipedia.org/wiki/Dirty_data Source : Wikipédia ]  


[https://www.talend.com/fr/resources/what-is-data-cleansing/#:~:text=Les%20donn%C3%A9es%20qui%20pr%C3%A9sentent%20les%20probl%C3%A8mes%20d%E2%80%99erreur%20et,%C2%BB%2C%20et%20leur%20impact%20global%20n%E2%80%99est%20pas%20n%C3%A9gligeable.  Source : Talend ]


[[:Catégorie:ISI | © Glossaire de la statistique DataFranca]]<br>
{{Modèle:Statistiques}}
[[Catégorie:ISI]]
[[Catégorie:Statistiques]]

Dernière version du 23 août 2024 à 19:21

Définition

Les données sales sont des données inexactes, incomplètes ou incohérentes, notamment dans un système informatique ou une base de données.

Les données sales peuvent contenir des erreurs telles que des fautes d'orthographe ou de ponctuation, des données incorrectes associées à un champ, des données incomplètes ou périmées, voire des données qui ont été dupliquées dans la base de données. Elles peuvent être nettoyées grâce à un processus connu sous le nom de nettoyage de données.

Français

données sales

Anglais

dirty data

Sources

Source : ISI Glossaire

Source : ISI

Source : Definir-tech

Source : Wikipédia

Source : Talend


GLOSSAIRE DE LA STATISTIQUE

Isi-logo-stats.jpg

Contributeurs: Claire Gorjux, wiki