« Contamination des données par indiscrétion » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 5 : | Ligne 5 : | ||
==Définition== | ==Définition== | ||
Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage. | Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage. Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheurs sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test. | ||
==Français== | ==Français== |
Version du 22 décembre 2019 à 18:17
Définition
Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage. Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheurs sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.
Français
contamination des données par furetage loc. nom. fém.
contamination des données par indiscrétion loc. nom. fém.
contamination par les données loc. nom. fém.
Anglais
compositionality
Contributeurs: Claude Coulombe, Jacques Barolet, Julie Roy, wiki