« Contamination des données » : différence entre les versions


(Page créée avec « == en construction == == Définition == La contamination des données fait référence à deux concepts : 1) celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la '''contamination des données par indiscrétion'''; 2) à des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses. == Françai... »)
 
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==
== Définition ==
La contamination des données fait référence à deux concepts :  
La contamination des données fait référence à deux concepts :  


1) celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la '''[[contamination des données par indiscrétion]]''';
1) À celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la '''[[contamination des données par indiscrétion]]''';


2) à des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses.
2) À celui des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses.


== Français ==
== Français ==
''' Contamination des données'''
''' contamination des données'''


== Anglais ==
== Anglais ==
''' Data Contamination'''
''' data contamination'''


== Source ==
== Source ==
'' À trouver''
[https://arxiv.org/abs/2203.08242  Source : arxiv]
 
[https://www.ibm.com/docs/en/watsonx/saas?topic=atlas-data-contamination  Source : IBM]
 
[https://vitrinelinguistique.oqlf.gouv.qc.ca/fiche-gdt/fiche/2074411/alteration-de-donnees  Source : La Vitrine linguistique, OQLF]


[[Catégorie:vocabulary]]
[[Catégorie:publication]]

Version du 22 novembre 2024 à 13:11

Définition

La contamination des données fait référence à deux concepts :

1) À celui de la divulgation volontaire ou involontaire de données ce qui peut nuire à l'entraînement et à la validation d'un modèle, comme la contamination des données par indiscrétion;

2) À celui des données qui ont été corrompues ou modifiées d’une manière ou d’une autre, les rendant inexactes, peu fiables ou trompeuses.

Français

contamination des données

Anglais

data contamination

Source

Source : arxiv

Source : IBM

Source : La Vitrine linguistique, OQLF

Contributeurs: Arianne , wiki