« Sauvegarde de l'estimation d'erreur » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 7 : | Ligne 7 : | ||
== Définition == | == Définition == | ||
== Compléments == | |||
Dans l'élagage d’un arbre de décision, l'un des problèmes avant de décider d'élaguer une branche de l'arbre est de savoir si l'erreur résultante sera plus grande si la branche est présente ou élaguée. Dans le cas où la branche est présente, on prend les erreurs estimées associées aux enfants des nœuds de la branche (qui bien sûr doivent avoir été préalablement calculées), on les multiplie par les fréquences estimées que la branche courante va classer des données à chaque enfant nœud, et additionne les produits résultants. Les fréquences sont estimées à partir du nombre d'instances de données d'apprentissage classées comme appartenant à chaque nœud enfant. Cette somme est appelée estimation d'erreur sauvegardée pour le nœud de branche. (Le concept d'estimation d'erreur sauvegardée n'a pas de sens pour un nœud feuille.) | |||
== Français == | == Français == | ||
''' | '''estimation rétrocalculée''' | ||
== Anglais == | == Anglais == | ||
'''Backed-up error estimate''' | '''Backed-up error estimate''' | ||
In decision tree pruning one of the issues in deciding whether to prune a branch of the tree is whether the estimated error in classification is greater if the branch is present or pruned. To estimate the error if the branch is present, one takes the estimated errors associated with the children of the branch nodes (which of course must have been previously computed), multiplies them by the estimated frequencies that the current branch will classify data to each child node, and adds up the resulting products. The frequencies are estimated from the numbers of training data instances that are classified as belonging to each child node. This sum is called the backed-up error estimate for the branch node. (The concept of a backed-up error estimate does not make sense for a leaf node.) | <!-- In decision tree pruning one of the issues in deciding whether to prune a branch of the tree is whether the estimated error in classification is greater if the branch is present or pruned. To estimate the error if the branch is present, one takes the estimated errors associated with the children of the branch nodes (which of course must have been previously computed), multiplies them by the estimated frequencies that the current branch will classify data to each child node, and adds up the resulting products. The frequencies are estimated from the numbers of training data instances that are classified as belonging to each child node. This sum is called the backed-up error estimate for the branch node. (The concept of a backed-up error estimate does not make sense for a leaf node.) --> | ||
See also expected error estimate. | See also expected error estimate. |
Version du 11 novembre 2022 à 13:39
copie de sécurité de l'erreur d'estimation
en construction
Définition
Compléments
Dans l'élagage d’un arbre de décision, l'un des problèmes avant de décider d'élaguer une branche de l'arbre est de savoir si l'erreur résultante sera plus grande si la branche est présente ou élaguée. Dans le cas où la branche est présente, on prend les erreurs estimées associées aux enfants des nœuds de la branche (qui bien sûr doivent avoir été préalablement calculées), on les multiplie par les fréquences estimées que la branche courante va classer des données à chaque enfant nœud, et additionne les produits résultants. Les fréquences sont estimées à partir du nombre d'instances de données d'apprentissage classées comme appartenant à chaque nœud enfant. Cette somme est appelée estimation d'erreur sauvegardée pour le nœud de branche. (Le concept d'estimation d'erreur sauvegardée n'a pas de sens pour un nœud feuille.)
Français
estimation rétrocalculée
Anglais
Backed-up error estimate
See also expected error estimate.
Contributeurs: Claude Coulombe, Imane Meziani, Marie Alfaro, Patrick Drouin, wiki