Bidouillage de la valeur-p


Définition

Adaptation de l'analyse statistique en cours de réalisation, en fonction des résultats qu’elle produit jusqu'à l'obtention d'une valeur-p inférieure à 0,05.

Compléments

Le fait d'obtenir d’une valeur-p inférieure à 0,05 (ou 1/20) ne doit pas être considéré comme une preuve statistique. Des analyses statistiques complémentaires permettent d’améliorer les résultats


Ces adaptations peuvent concerner aussi bien la méthode statistique (choix de la méthode, transformation de variables, choix des covariables d’ajustement, etc.) que le jeu de données (exclusion de patients, gestion des évènements intercurrents, restriction de l’analyse à une sous population, etc.)


Une solution réside dans la conception à l'avance d'une plan de l'analyse statistique d'une façon complètement indépendante des données et des résultats produits. Lorsque l’on fait plusieurs tests statistiques, la probabilité d’obtenir un résultat positif par hasard augmente exponentiellement. Il faut donc augmenter significativement le seuil de détection pour faire une découverte (entre autres avec la Correction de Bonferroni).

Français

bidouillage de la valeur-p

bidouillage-p

Anglais

p-hacking

p hacking

Data dredging

Sources

Source: Société française de pharmacologie et de thérapeuthique

Source: Wikipedia

Source: Head et al. 2015

Contributeurs: Patrick Drouin, wiki