Contamination des données


Révision datée du 22 novembre 2024 à 16:17 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

La contamination des données fait référence à deux concepts :

1) À celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la contamination des données par indiscrétion;

2) À celui des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses.

Français

contamination des données

Anglais

data contamination

Source

Source : arxiv

Source : IBM

Source : La Vitrine linguistique, OQLF

Contributeurs: Arianne , wiki