« Estimation de l'erreur de prédiction » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 4 : Ligne 4 :


== Définition ==
== Définition ==
Dans un algorithme, somme des fréquences estimées à partir du nombre de données d’entraînement qui sont classées comme appartenant à chaque nœud enfant.
Dans un algorithme de traitement de graphe, somme des fréquences estimées à partir du nombre de données d’entraînement qui se situent sous chaque nœud branche (c.-à-d. un nœud parent).
 
un algorithme de (rétro)calcul ou d'arbres de décision


== Compléments ==  
== Compléments ==  
Cette somme est appelée la sauvegarde de l'estimation d'erreur pour le nœud de branche; la sauvegarde d'estimation d'erreur n'a pas de sens pour un nœud feuille.
Cette somme est l'estimation d'erreur pour un nœud branche; l'estimation d'erreur n'a pas de sens pour un nœud feuille (c.-à-d. un nœud enfant terminal).


Dans le cadre de l'élagage d'un arbre de décision, l'une des questions qui se pose pour décider de l'élagage d'une branche de l'arbre est de savoir si l'erreur estimée de classification est plus importante dans le cas où la branche est présente ou élaguée.  
Dans le cadre de l'élagage d'un arbre de décision, l'une des questions qui se pose pour décider de l'élagage d'une branche de l'arbre est de savoir si l'erreur estimée est plus importante dans le cas où la branche est présente ou élaguée.  


Pour estimer l'erreur si la branche est présente, on prend les erreurs estimées associées aux enfants des nœuds de la branche (qui doivent bien sûr avoir été calculées au préalable), on les multiplie par les fréquences estimées selon lesquelles la branche actuelle classera les données dans chaque nœud enfant, et on additionne les produits résultants.  
Pour estimer l'erreur, on prend les erreurs estimées associées aux nœuds enfants d'une branche dont on fait une somme pondérée par les fréquences.  


== Français ==
== Français ==
Ligne 29 : Ligne 27 :
'''expected error estimate'''
'''expected error estimate'''


'''Laplace error estimate'''
<!-- '''Laplace error estimate''' -->
 
In pruning a decision tree, one needs to be able to estimate the expected error at any node (branch or leaf). This can be done using the '''Laplace error estimate''', which is given by the formula<center>''E''(''S'') = (''N'' – ''n'' + ''k'' – 1) / (''N'' + ''k'').</center>where
{| class="wikitable"
|''S''
|is the set of instances in a node
|-
|''k''
|is the number of classes (e.g. 2 if instances are just being classified into 2 classes: say positive and negative)
|-
|''N''
|is the is the number of instances in ''S''
|-
|''C''
|is the majority class in ''S''
|-
|''n''
|out of ''N'' examples in ''S'' belong to ''C''
|}


<small>
<small>


[http://www.cse.unsw.edu.au/~billw/dictionaries/mldict.html      Source : INWS machine learning dictionary]
[http://www.cse.unsw.edu.au/~billw/dictionaries/mldict.html      Source : INWS machine learning dictionary]

Version du 24 janvier 2023 à 15:52

en construction

Définition

Dans un algorithme de traitement de graphe, somme des fréquences estimées à partir du nombre de données d’entraînement qui se situent sous chaque nœud branche (c.-à-d. un nœud parent).

Compléments

Cette somme est l'estimation d'erreur pour un nœud branche; l'estimation d'erreur n'a pas de sens pour un nœud feuille (c.-à-d. un nœud enfant terminal).

Dans le cadre de l'élagage d'un arbre de décision, l'une des questions qui se pose pour décider de l'élagage d'une branche de l'arbre est de savoir si l'erreur estimée est plus importante dans le cas où la branche est présente ou élaguée.

Pour estimer l'erreur, on prend les erreurs estimées associées aux nœuds enfants d'une branche dont on fait une somme pondérée par les fréquences.

Français

estimation de l’erreur prédite

estimation d'erreur rétrocalculée

estimation d'erreur rétroestimée

erreur rétrocalculée


Anglais

expected error estimate


Source : INWS machine learning dictionary