Ré-échantillonnage avec remise ensembliste


Révision datée du 28 janvier 2024 à 13:11 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵<small> » par «  ==Sources== »)

Définition

Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.

Note: le résultat sera obtenu par le calcul de la moyenne pour une régression (prédiction d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prédiction d'une classe). Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la forêt aléatoire (random forest) est une extension très utilisée du ré-échantillonnage ensembliste.

Voir: Ré-échantillonage avec remise

Français

ré-échantillonnage avec remise ensembliste

agrégation par la méthode de Cyrano

agrégation de circuit fermé

Anglais

bagging

bootstrap aggregation

Gradient Bagging


Sources

Source: Wang, Jianqiang C ; Jean D. Opsomer et Haonan Wang (2014). L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes, Statistique Canada.

Source: Claude Coulombe, Datafranca.org

Source: Termino