« Sous-échantillonnage aléatoire » : différence entre les versions

Version du 14 décembre 2020 à 03:17

Définition

Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé sous-échantillonnage, et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle suréchantillonnage.

Français

Sous-échantillonnage aléatoire masculin

Sur-échantillonnage aléatoire masculin

Anglais

Random Under-Sampling

Random Over-Sampling

Source : machine learning mastery

@@ Ligne 1 : / Ligne 1 : @@
 == Définition ==
-Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelés '''sous-échantillonnage''', et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle '''suréchantillonnage'''.
+Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé '''sous-échantillonnage''', et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle '''suréchantillonnage'''.
 == Français ==

« Sous-échantillonnage aléatoire » : différence entre les versions

Version du 14 décembre 2020 à 03:17

Définition

Français

Anglais

« Sous-échantillonnage aléatoire » : différence entre les versions