Ré-échantillonnage avec remise ensembliste
Définition
Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.
Note: le résultat sera obtenu par le calcul de la moyenne pour une régression (prédiction d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prédiction d'une classe). Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la forêt aléatoire (random forest) est une extension très utilisée du ré-échantillonnage ensembliste.
Voir: Ré-échantillonage avec remise
Français
ré-échantillonnage avec remise ensembliste
agrégation par la méthode de Cyrano
agrégation de circuit fermé
Anglais
bagging
bootstrap aggregation
Gradient Bagging
Sources
Contributeurs: Jacques Barolet, Julie Roy, Patrick Drouin, wiki