« Bidouillage de la valeur-p » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 7 : Ligne 7 :
Ces adaptations peuvent concerner aussi bien la méthode statistique (choix de la méthode, transformation de variables, choix des covariables d’ajustement, etc.) que le jeu de données (exclusion de patients, gestion des évènements intercurrents, restriction de l’analyse à une sous population, etc.)
Ces adaptations peuvent concerner aussi bien la méthode statistique (choix de la méthode, transformation de variables, choix des covariables d’ajustement, etc.) que le jeu de données (exclusion de patients, gestion des évènements intercurrents, restriction de l’analyse à une sous population, etc.)
<hr/>
<hr/>
Une solution réside dans la conception à l'avance d'une plan de l'analyse statistique d'une façon complètement indépendante des données et des résultats produits. Le problème est que lorsque l’on fait plusieurs [[test statistique|tests statistiques]], la probabilité d’obtenir un résultat positif par hasard augmente exponentiellement. Il faut donc augmenter significativement le seuil de détection pour faire une découverte (correction de Bonferonni).
Une solution réside dans la conception à l'avance d'une plan de l'analyse statistique d'une façon complètement indépendante des données et des résultats produits. Lorsque l’on fait plusieurs [[test statistique|tests statistiques]], la probabilité d’obtenir un résultat positif par hasard augmente exponentiellement. Il faut donc augmenter significativement le seuil de détection pour faire une découverte (entre autres avec la correction de Bonferonni).


==Français==
==Français==

Version du 15 août 2023 à 15:01

Définition

Adaptation de l'analyse statistique en cours de réalisation, en fonction des résultats qu’elle produit jusqu'à l'obtention d'une valeur-p inférieure à 0,05.

Compléments

Le fait d'obtenir d’une valeur-p inférieure à 0,05 (ou 1/20) ne doit pas être considéré comme une preuve statistique. Des analyses statistiques complémentaires permettent d’améliorer les résultats


Ces adaptations peuvent concerner aussi bien la méthode statistique (choix de la méthode, transformation de variables, choix des covariables d’ajustement, etc.) que le jeu de données (exclusion de patients, gestion des évènements intercurrents, restriction de l’analyse à une sous population, etc.)


Une solution réside dans la conception à l'avance d'une plan de l'analyse statistique d'une façon complètement indépendante des données et des résultats produits. Lorsque l’on fait plusieurs tests statistiques, la probabilité d’obtenir un résultat positif par hasard augmente exponentiellement. Il faut donc augmenter significativement le seuil de détection pour faire une découverte (entre autres avec la correction de Bonferonni).

Français

bidouillage de la valeur-p

bidouillage-p


Anglais

p-hacking

p hacking

Data dredging

Source: Société française de pharmacologie et de thérapeuthique

Source: Wikipedia

Source: Head et al. 2015

Contributeurs: Patrick Drouin, wiki