« Contamination des données par indiscrétion » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Ligne 1 : Ligne 1 :
== Domaine ==
[[Category:Vocabulaire]]
[[Category:Vocabulaire]]
[[Category:Intelligence artificielle]]Intelligence artificielle<br />
[[Category:Intelligence artificielle]]
[[Category:Termino 2019]]
[[Category:Termino 2019]]


== Définition ==
== Définition ==
Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage.
Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage.


Note:
Note: Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheur sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.
 
Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheur sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.


== Français ==
== Français ==
Ligne 19 : Ligne 15 :
'''contamination par les données'''
'''contamination par les données'''


== Anglais ==
'''compositionality'''


Source : Claude Coulombe


Source : Patrick Drouin
[[Utilisateur:Claude COULOMBE | source : Claude Coulombe, Datafranca.org]]       
 
 
 
[[Utilisateur:Patrickdrouin  | Source : Termino  ]]
== Anglais ==
 
'''compositionality'''

Version du 17 juin 2019 à 14:29


Définition

Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage.

Note: Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheur sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.

Français

contamination des données par furetage

contamination des données par indiscrétion

contamination par les données

Anglais

compositionality


source : Claude Coulombe, Datafranca.org

Source : Termino