« Diagramme de la distance de Cook » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == ''' Cook’s Distance Plot''' The Cook's distance measures the impact... ») |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== | == Définition == | ||
En statistique, la distance de Cook est couramment utilisée pour estimer l'influence d'une donnée lors de l'utilisation de méthodes des moindres carrés. | |||
Dans le cas général, de l'utilisation de la méthode des moindres carrés, la distance de Cook peut être utilisée de plusieurs façons : pour indiquer les données qu'il serait intéressant de vérifier; pour indiquer les régions de l'espace de conception où il serait bon d'être en mesure d'obtenir plus de points de données. Ce nom vient du statisticien américain R. Dennis Cook, qui a introduit le concept en 1977. | |||
== Français == | == Français == | ||
''' | ''' Distance de Cook ''' | ||
== Anglais == | == Anglais == | ||
''' Cook’s Distance Plot''' | ''' Cook’s Distance Plot''' | ||
The Cook's distance measures the impact of instances on linear regression. Instances with large impacts are considered as outliers. A dataset with a large number of outliers is not suitable for linear regression without preprocessing. Simply, the Cook’s distance plot is used to detect outliers in the dataset. | |||
<small> | <small> | ||
Ligne 16 : | Ligne 16 : | ||
[https://towardsdatascience.com/10-amazing-machine-learning-visualizations-you-should-know-in-2023-528282940582 Source : towardsdatascience ] | [https://towardsdatascience.com/10-amazing-machine-learning-visualizations-you-should-know-in-2023-528282940582 Source : towardsdatascience ] | ||
[https://fr.wikipedia.org/wiki/Distance_de_Cook Source : Wikipedia ] | |||
[[Catégorie:vocabulary]] | [[Catégorie:vocabulary]] | ||
[[Catégorie:publication]] |
Version du 5 décembre 2022 à 14:31
Définition
En statistique, la distance de Cook est couramment utilisée pour estimer l'influence d'une donnée lors de l'utilisation de méthodes des moindres carrés.
Dans le cas général, de l'utilisation de la méthode des moindres carrés, la distance de Cook peut être utilisée de plusieurs façons : pour indiquer les données qu'il serait intéressant de vérifier; pour indiquer les régions de l'espace de conception où il serait bon d'être en mesure d'obtenir plus de points de données. Ce nom vient du statisticien américain R. Dennis Cook, qui a introduit le concept en 1977.
Français
Distance de Cook
Anglais
Cook’s Distance Plot
The Cook's distance measures the impact of instances on linear regression. Instances with large impacts are considered as outliers. A dataset with a large number of outliers is not suitable for linear regression without preprocessing. Simply, the Cook’s distance plot is used to detect outliers in the dataset.
Contributeurs: Marie Alfaro, wiki