Sauvegarde de l'estimation d'erreur
Définition
Dans le cadre de l'élagage d'un arbre de décision, l'une des questions qui se pose pour décider de l'élagage d'une branche de l'arbre est de savoir si l'erreur estimée de classification est plus importante dans le cas où la branche est présente ou élaguée.
Pour estimer l'erreur si la branche est présente, on prend les erreurs estimées associées aux enfants des nœuds de la branche (qui doivent bien sûr avoir été calculées au préalable), on les multiplie par les fréquences estimées selon lesquelles la branche actuelle classera les données dans chaque nœud enfant, et on additionne les produits résultants.
Les fréquences sont estimées à partir du nombre d'instances de données de formation qui sont classées comme appartenant à chaque nœud enfant. Cette somme est appelée la sauvegarde de l'estimation d'erreur pour le nœud de branche. (Le concept d'une sauvegarde d'estimation d'erreur n'a pas de sens pour un nœud feuille).
Voir aussi expected error estimate.
Français
estimation d'erreur rétrocalculée
erreur rétrocalculée
sauvegarde de l’estimation d’erreur
estimation de l’erreur
Anglais
backed-up error estimate
Contributeurs: Claude Coulombe, Imane Meziani, Marie Alfaro, Patrick Drouin, wiki