p-value

La p-value (ou « valeur p ») est un indicateur statistique utilisé pour évaluer la signifiance d’un résultat expérimental. Dans le cadre d’un test A/B, elle mesure la probabilité d’obtenir un résultat aussi extrême que celui observé, en supposant que l’hypothèse nulle (H₀) soit vraie (c’est-à-dire qu’il n’y ait aucune différence réelle entre les variantes).


1. Comment l’interpréter ?

  • Une p-value faible (ex. ≤ 0,05) indique que le résultat observé est peu probable si H₀ est vraie → on peut rejeter H₀ et conclure à une différence significative.

  • Une p-value élevée (> 0,05) indique que le résultat observé est compatible avec H₀on ne rejette pas H₀ ; le test n’a pas montré de différence claire.

⚠️ La p-value ne donne pas la probabilité que H₀ soit vraie, ni la probabilité que la variante testée soit meilleure.


2. Seuil de significativité (alpha)

Le niveau de confiance le plus courant est α = 0,05 :

  • Si p-value ≤ 0,05 → on considère le résultat comme statistiquement significatif.

  • Ce seuil peut être abaissé (ex. 0,01) pour les décisions critiques.


3. Ce que la p-value n’est pas

Idée fausse Correction
« Si p = 0,04, alors il y a 96 % de chances que l’effet soit réel » Faux : la p-value ne dit rien sur la probabilité que H₁ soit vraie
« Une p > 0,05 prouve que la variante est inefficace » Non : cela signifie simplement qu’on ne peut pas conclure à une différence
« Une p-value faible garantit un fort impact business » Pas nécessairement : la significativité ≠ magnitude de l’effet

4. Liens avec puissance, taille d’échantillon et MDE

  • Une petite taille d’échantillon augmente le risque de p-value non significative même si un effet réel existe (erreur de type II).

  • Une p-value seule n’est jamais suffisante : il faut l’interpréter avec l’intervalle de confiance, la puissance statistique et le MDE.


5. Bonnes pratiques en CRO

  • Toujours pré-spécifier le seuil α et le KPI testé.

  • Accompagner la p-value d’un intervalle de confiance.

  • Éviter les multiples tests non corrigés (risque de faux positifs).

  • Ne pas s’arrêter dès qu’on atteint p < 0,05 : la robustesse prime sur l’opportunisme.


⚡ En résumé

La p-value est un outil de détection, pas de preuve : elle vous aide à décider si les résultats d’un test A/B sont suffisamment surprenants pour remettre en cause le statu quo. Mal comprise, elle mène à des erreurs d’interprétation ; bien utilisée, elle renforce la rigueur et la crédibilité de vos expérimentations.

 

Devenez expert en CRO !

Soyez reconnu et rejoignez le top 1% des experts CRO Français grâce à une méthode structurée pour déployer un programme d'expérimentation impactant.