« Sous-échantillonnage aléatoire » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
 
(20 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Domaine ==
== Définition ==
Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé '''sous-échantillonnage''', et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle '''suréchantillonnage'''.
 
== Français ==
'''Sous-échantillonnage aléatoire''' 
 
'''Sur-échantillonnage aléatoire''' 


[[Category:Vocabulary]]  Vocabulary
== Anglais ==
'''Random Under-Sampling '''
 
'''Random Over-Sampling '''


== Définition ==


==Sources==


== Termes privilégiés ==
[https://machinelearningmastery.com/random-oversampling-and-undersampling-for-imbalanced-classification/  Source : machine learning mastery ]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
== Anglais ==

Dernière version du 28 janvier 2024 à 12:03

Définition

Une approche pour résoudre le problème du déséquilibre de classe consiste à rééchantillonner de manière aléatoire l’ensemble de données d’apprentissage. Les deux principales approches pour rééchantillonner au hasard un ensemble de données déséquilibré consistent à supprimer des exemples de la classe majoritaire, appelé sous-échantillonnage, et à dupliquer des exemples de la classe minoritaire, ce qu’on appelle suréchantillonnage.

Français

Sous-échantillonnage aléatoire

Sur-échantillonnage aléatoire

Anglais

Random Under-Sampling

Random Over-Sampling


Sources

Source : machine learning mastery

Contributeurs: Imane Meziani, wiki, Sihem Kouache