« Détection des données aberrantes » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 5 : Ligne 5 :


== Définition ==
== Définition ==
La détection des données aberrantes fait référence à la méthode d'identification et de classification utilisée pour identifier les observations qui sont distinctement différentes ou éloignées des autres.
La détection des données aberrantes fait référence à la méthode d’identification et de classification utilisée pour identifier les observations qui sont distinctement différentes ou s’écartent des autres observations.


En outre, les valeurs aberrantes sont également définies par leur environnement. Les valeurs aberrantes éloignées du reste des données sont appelées «points aberrants». Alternativement, des «données aberrantes contextuelles» sont trouvées dans les données, apparaissant souvent sous forme de bruit.
En outre, les valeurs aberrantes sont également définies par leur environnement. Les valeurs aberrantes qui sont éloignées du reste des données sont appelées « points aberrants ». Alternativement, des « données aberrantes contextuelles » sont trouvées dans les données, apparaissant souvent sous forme de bruit.


== Français ==
== Français ==
Ligne 33 : Ligne 33 :
[[Catégorie:vocabulaire]]
[[Catégorie:vocabulaire]]
[[Catégorie:vocabulary]]
[[Catégorie:vocabulary]]
[[Catégorie:sihem]]
[[Catégorie:9]]

Version du 22 janvier 2021 à 19:12

en construction

voir Donnée pertinente

voir Donnée aberrante

Définition

La détection des données aberrantes fait référence à la méthode d’identification et de classification utilisée pour identifier les observations qui sont distinctement différentes ou s’écartent des autres observations.

En outre, les valeurs aberrantes sont également définies par leur environnement. Les valeurs aberrantes qui sont éloignées du reste des données sont appelées « points aberrants ». Alternativement, des « données aberrantes contextuelles » sont trouvées dans les données, apparaissant souvent sous forme de bruit.

Français

Identification des données aberrantes

Identification des points aberrants

Anglais

Outlier Detection

Outlier Detection refers to the method of identification and classification used to identify observations that are distinctly different or far from others.

A popular method to clean a data set, outlier detection allows for defined outliers to inform classification of new observations as anomalies. Outliers are defined between two categories: univariate and multivariate. Univariate outliers are found in distributions in a single feature space, whereas multivariate outliers are found in n-dimensional spaces.

Furthermore, outliers are also defined by their environment. Outliers that lay far away from the rest of the data are called "point outliers." Alternatively, "contextual outliers" are found within the data, often appearing as noise.

There are a multitude of factors that can contribute to the appearance of an outlier, however those that are not the product of an error are called "novelties."



Source : DeepAI.org



Contributeurs: Imane Meziani, wiki, Sihem Kouache