Contamination des données


Révision datée du 22 novembre 2024 à 13:12 par Arianne (discussion | contributions) (Arianne a déplacé la page Data Contamination vers Contamination des données sans laisser de redirection)

Définition

La contamination des données fait référence à deux concepts :

1) À celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la contamination des données par indiscrétion;

2) À celui des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses.

Français

contamination des données

Anglais

data contamination

Source

Source : arxiv

Source : IBM

Source : La Vitrine linguistique, OQLF

Contributeurs: Arianne , wiki