Ré-échantillonnage avec remise ensembliste


Domaine

Intelligence artificielle





Définition

Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.



Français

ré-échantillonnage avec remise ensembliste

agrégation bootstrap

agrégation par bootstrap

agrégation par la méthode de Cyrano


Note

Le résultat sera obtenu par le calcul de la moyenne pour une régression (prédiction d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prédiction d'une classe). Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la forêt aléatoire (en anglais, "random forest") est une extension très utilisée du ré-échantillonnage ensembliste.


Source : Claude Coulombe

Source : Patrick Drouin

Source : Wang, Jianqiang C.; Jean D. Opsomer et Haonan Wang (2014). L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes, Statistique Canada, https://www150.statcan.gc.ca/n1/pub/12-001-x/2014002/article/14118-fra.htm, consulté le 28 mai 2019.


Anglais

bagging

bootstrap aggregation