En statistique, la valeur p est la probabilité d'obtenir des résultats au moins aussi extrêmes que les résultats observés d'un test d'hypothèse statistique, en supposant que l'hypothèse nulle est correcte. La valeur p est utilisée comme alternative aux points de rejet pour fournir le plus petit niveau de signification auquel l'hypothèse nulle serait rejetée. Une valeur de p plus petite signifie qu'il existe des preuves plus solides en faveur de l'hypothèse alternative.
Les valeurs de p sont généralement trouvées à l'aide de tableaux de valeurs de p ou de tableurs/logiciels statistiques. Ces calculs sont basés sur la distribution de probabilité supposée ou connue de la statistique spécifique testée. Les p-values sont calculées à partir de l'écart entre la valeur observée et une valeur de référence choisie, compte tenu de la distribution de probabilité de la statistique, une plus grande différence entre les deux valeurs correspondant à une p-value plus faible.
Mathématiquement, la valeur p est calculée à l'aide d'un calcul intégral à partir de l'aire sous la courbe de distribution de probabilité pour toutes les valeurs de statistiques qui sont au moins aussi éloignées de la valeur de référence que la valeur observée, par rapport à l'aire totale sous la courbe de distribution de probabilité . Le calcul d'une valeur p varie en fonction du type de test effectué. Les trois types de test décrivent l'emplacement sur la courbe de distribution de probabilité :test à queue inférieure, test à queue supérieure ou test bilatéral.
En un mot, plus la différence entre deux valeurs observées est grande, moins il est probable que la différence soit due au simple hasard, et cela se traduit par une valeur p plus faible.
L'approche de la valeur p pour le test d'hypothèse utilise la probabilité calculée pour déterminer s'il existe des preuves pour rejeter l'hypothèse nulle. L'hypothèse nulle, également connue sous le nom de "conjecture", est l'affirmation initiale concernant une population (ou un processus de génération de données). L'hypothèse alternative indique si le paramètre de population diffère de la valeur du paramètre de population indiquée dans la conjecture.
En pratique, le niveau de signification est indiqué à l'avance pour déterminer à quel point la valeur de p doit être petite afin de rejeter l'hypothèse nulle. Étant donné que différents chercheurs utilisent différents niveaux de signification lors de l'examen d'une question, un lecteur peut parfois avoir des difficultés à comparer les résultats de deux tests différents. Les valeurs P fournissent une solution à ce problème.
Par exemple, supposons qu'une étude comparant les rendements de deux actifs particuliers ait été entreprise par différents chercheurs qui ont utilisé les mêmes données mais des niveaux de signification différents. Les chercheurs pourraient arriver à des conclusions opposées quant à savoir si les actifs diffèrent. Si un chercheur utilisait un niveau de confiance de 90 % et que l'autre exigeait un niveau de confiance de 95 % pour rejeter l'hypothèse nulle et que la valeur p de la différence observée entre les deux rendements était de 0,08 (correspondant à un niveau de confiance de 92 %) , alors le premier chercheur trouverait que les deux actifs ont une différence statistiquement significative, tandis que le second ne trouverait aucune différence statistiquement significative entre les rendements.
Pour éviter ce problème, les chercheurs pourraient indiquer la valeur p du test d'hypothèse et permettre aux lecteurs d'interpréter eux-mêmes la signification statistique. C'est ce qu'on appelle une approche de la valeur p pour les tests d'hypothèses. Des observateurs indépendants pourraient noter la valeur p et décider eux-mêmes si cela représente une différence statistiquement significative ou non.
Un investisseur prétend que la performance de son portefeuille d'investissement est équivalente à celle de l'indice Standard &Poor's (S&P) 500. Pour le déterminer, l'investisseur procède à un test bilatéral. L'hypothèse nulle indique que les rendements du portefeuille sont équivalents aux rendements du S&P 500 sur une période donnée, tandis que l'hypothèse alternative indique que les rendements du portefeuille et les rendements du S&P 500 ne sont pas équivalents - si l'investisseur a effectué un test unilatéral, l'alternative l'hypothèse indiquerait que les rendements du portefeuille sont inférieurs ou supérieurs aux rendements du S&P 500.
Le test de l'hypothèse de la valeur p n'utilise pas nécessairement un niveau de confiance présélectionné auquel l'investisseur devrait réinitialiser l'hypothèse nulle selon laquelle les rendements sont équivalents. Au lieu de cela, il fournit une mesure de la quantité de preuves disponibles pour rejeter l'hypothèse nulle. Plus la valeur de p est petite, plus la preuve contre l'hypothèse nulle est grande. Ainsi, si l'investisseur trouve que la valeur p est de 0,001, il existe des preuves solides contre l'hypothèse nulle, et l'investisseur peut conclure en toute confiance que les rendements du portefeuille et les rendements du S&P 500 ne sont pas équivalents.
Bien que cela ne fournisse pas de seuil exact quant au moment où l'investisseur doit accepter ou rejeter l'hypothèse nulle, cela présente un autre avantage très pratique. Les tests d'hypothèse de valeur P offrent un moyen direct de comparer la confiance relative que l'investisseur peut avoir lorsqu'il choisit parmi plusieurs types d'investissements ou de portefeuilles différents par rapport à un indice de référence tel que le S&P 500.
Par exemple, pour deux portefeuilles, A et B, dont la performance diffère du S&P 500 avec des valeurs p de 0,10 et 0,01, respectivement, l'investisseur peut être beaucoup plus confiant que le portefeuille B, avec une valeur p inférieure, affichera réellement résultats constamment différents.
Une valeur de p inférieure à 0,05 est généralement considérée comme statistiquement significative, auquel cas l'hypothèse nulle doit être rejetée. Une valeur de p supérieure à 0,05 signifie que l'écart par rapport à l'hypothèse nulle n'est pas statistiquement significatif et que l'hypothèse nulle n'est pas rejetée.
Une valeur de p de 0,001 indique que si l'hypothèse nulle testée était effectivement vraie, il y aurait 1 chance sur 1 000 d'observer des résultats au moins aussi extrêmes. Cela conduit l'observateur à rejeter l'hypothèse nulle car soit un résultat de données très rare a été observé, soit l'hypothèse nulle est incorrecte.
Si vous avez deux résultats différents, l'un avec une valeur de p de 0,04 et l'autre avec une valeur de p de 0,06, le 0,04 sera considéré comme statistiquement significatif alors que 0,06 ne l'est pas. Au-delà de cet exemple simplifié, vous pouvez comparer une valeur de p de 0,04 à une valeur de p de 0,001. Les deux sont statistiquement significatifs, mais le .001 fournit un argument encore plus solide contre l'hypothèse nulle que le .04.