« Sous-échantillonnage aléatoire » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, | Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé '''sous-échantillonnage''', et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle '''suréchantillonnage'''. | ||
== Français == | == Français == |
Version du 14 décembre 2020 à 02:17
Définition
Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé sous-échantillonnage, et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle suréchantillonnage.
Français
Sous-échantillonnage aléatoire masculin
Sur-échantillonnage aléatoire masculin
Anglais
Random Under-Sampling
Random Over-Sampling
Contributeurs: Imane Meziani, wiki, Sihem Kouache