Sous-échantillonnage aléatoire


Révision datée du 28 janvier 2024 à 12:03 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé sous-échantillonnage, et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle suréchantillonnage.

Français

Sous-échantillonnage aléatoire

Sur-échantillonnage aléatoire

Anglais

Random Under-Sampling

Random Over-Sampling


Sources

Source : machine learning mastery

Contributeurs: Imane Meziani, wiki, Sihem Kouache