Contamination des données


(Redirigé depuis Data contamination)

Définition

La contamination des données fait référence à deux concepts :

1) À celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la contamination des données par indiscrétion;

2) À celui des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses.

Français

contamination des données

Anglais

data contamination

Source

Source : arxiv

Source : IBM

Source : La Vitrine linguistique, OQLF

Contributeurs: Arianne , wiki