Contamination des données par indiscrétion


Révision datée du 20 novembre 2024 à 03:55 par Claude COULOMBE (discussion | contributions) (Claude COULOMBE a déplacé la page Contamination des données par furetage vers Contamination des données par indiscrétion par-dessus une redirection)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage. Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheurs sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.

Français

contamination des données par indiscrétion

contamination des données par furetage

Anglais

compositionality contamination

Sources

Source: Claude Coulombe, Datafranca.org

Source: Termino