« Ensemble de données déséquilibré » : différence entre les versions

Dernière version du 31 janvier 2024 à 11:05

Définition

Les ensembles de données déséquilibrés sont ceux où l'attribut cible (l'attribut à prédire) est distribué de manière inégale. Par exemple, la prédiction de transactions frauduleuses par carte de crédit est un excellent exemple d'ensemble de données déséquilibré.

Français

Ensemble de données déséquilibré

Anglais

Imbalanced Dataset

Sources

Source : towardsdatascience

@@ Ligne 1 : / Ligne 1 : @@
-==en construction==
 == Définition ==
-Les ensembles de données déséquilibrés sont ceux où l'attribut cible (l'attribut à prédire) est distribué de manière inégale. Ce scénario n'est certainement pas rare lorsque l'on travaille sur des problèmes de science des données. Par exemple, la prédiction de transactions frauduleuses par carte de crédit est un excellent exemple d'ensemble de données déséquilibré. En effet, la plupart des transactions par carte de crédit sont authentiques. Pourtant, il existe également des transactions frauduleuses.
+Les ensembles de données déséquilibrés sont ceux où l'attribut cible (l'attribut à prédire) est distribué de manière inégale. Par exemple, la prédiction de transactions frauduleuses par carte de crédit est un excellent exemple d'ensemble de données déséquilibré.
-Les ensembles de données déséquilibrés nécessitent une attention particulière, car l'approche normale de la construction de modèles ou de l'évaluation des performances ne fonctionnerait pas
 == Français ==
@@ Ligne 12 : / Ligne 8 : @@
 ''' Imbalanced Dataset'''
-  Imbalanced datasets are those where the target attribute (the attribute to be predicted) is unevenly distributed. This is definitely not an uncommon scenario while working on data science problems. For example, predicting fraudulent credit card transactions is an excellent example of an imbalanced dataset. Because most of the credit card transactions would be genuine. Yet there are some fraudulent transactions as well.
+==Sources==
- The imbalanced datasets need special attention as the normal approach to building models or evaluating performance would not work. Here is an article that talks in detail about imbalanced datasets and the best approaches to handle them better.
-<small>
 [https://towardsdatascience.com/decoding-the-top-10-data-science-jargons-for-beginners-commonly-asked-in-interviews-436b5afbe3c0  Source : towardsdatascience]
-[[Catégorie:vocabulary]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]