« Ensemble de données avec déséquilibre des classes » : différence entre les versions


m (Remplacement de texte — « <small> masculin </small> » par «  »)
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
Ligne 9 : Ligne 9 :




<small>
 
==Sources==


[https://developers.google.com/machine-learning/glossary/  Source: Google, ''Machine learning glossary'' ]
[https://developers.google.com/machine-learning/glossary/  Source: Google, ''Machine learning glossary'' ]

Version du 27 janvier 2024 à 22:48

Définition

Problème de classification binaire dans lequel les fréquences des étiquettes des deux classes sont significativement différentes. Par exemple, un ensemble de données de maladie dans lequel 0,0001 des exemples ont des étiquettes positives et 0,9999 ont des étiquettes négatives est un problème de déséquilibre des classes. Par contre, une prédiction de match de football dans laquelle 0,51 des exemples étiquettent une équipe comme gagnante et 0,49 étiquettent l'autre équipe comme gagnante n'est pas un problème avec un déséquilibre des classes.

Français

ensemble de données avec déséquilibre des classes

Anglais

class-imbalanced data set


Sources

Source: Google, Machine learning glossary