« Sous-échantillonnage aléatoire » : différence entre les versions
m (Remplacement de texte — « <small> masculin </small> » par « ») |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
Ligne 13 : | Ligne 13 : | ||
==Sources== | |||
[https://machinelearningmastery.com/random-oversampling-and-undersampling-for-imbalanced-classification/ Source : machine learning mastery ] | [https://machinelearningmastery.com/random-oversampling-and-undersampling-for-imbalanced-classification/ Source : machine learning mastery ] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 28 janvier 2024 à 12:03
Définition
Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé sous-échantillonnage, et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle suréchantillonnage.
Français
Sous-échantillonnage aléatoire
Sur-échantillonnage aléatoire
Anglais
Random Under-Sampling
Random Over-Sampling
Sources
Contributeurs: Imane Meziani, wiki, Sihem Kouache