Mathieu Fauveaux

Sample Ratio Mismatch (Erreur SRM)

L’erreur SRM survient lorsqu’il existe un écart statistiquement significatif entre la répartition prévue du trafic (ex. 50 % / 50 %) et la répartition observée des utilisateurs dans les groupes d’un test A/B. Cet écart indique un problème de randomisation ou de collecte des données, susceptible de biaiser toutes les conclusions.

1. Définition formelle

Allocation attendue : pour un total N d’utilisateurs et une proportion théorique p (ex. 0,5), on s’attend à N·p observations dans chaque groupe.
Allocation observée : si les comptes réels diffèrent au‑delà de la variation aléatoire, on parle de Sample Ratio Mismatch.
Test statistique : on applique le χ² (Chi‑carré) à 1 degré de liberté ou un test exact de Fisher pour vérifier si l’écart est dû au hasard (α typique : 0,001 pour SRM, plus strict qu’un test d’effet). Si la p‑value < α, on déclare un SRM.

2. Causes courantes

Catégorie	Exemple
Bug de bucketing	Id utilisateur tronqué, hash non uniforme
Filtrage asymétrique	Bloqueurs d’annonces affectant seulement le groupe B
Sessions multiples	Même user_id mappé à plusieurs cookies
Ciblage post‑randomisation	Exclusions ou redirections appliquées après l’attribution
Période de warm‑up	Collecte démarrée avant que le routage soit stabilisé
Bot / trafic interne	Robots envoyés majoritairement sur une variante

3. Conséquences

Biais statistique : la variance et la taille d’échantillon effectives sont faussées.
Risque d’erreurs Type I / II : conclusions du test (gagnant / perdant) deviennent invalides.
Perte de confiance : crédibilité des expérimentations compromise auprès des parties prenantes.

4. Détection et réactions

Monitorer en temps réel : tableau SRM qui calcule p‑value du χ² après chaque batch de trafic.
Seuil stricte : α = 0,001 limite les faux positifs tout en détectant tôt un problème sérieux.
Arrêt immédiat : si SRM confirmé, suspendre le test ; ne pas interpréter les KPI.
Audit technique : revoir la logique de routing, les exclusions et le tracking des identifiants.
Correctif & relance : redémarrer le test après résolution, avec un nouvel identifiant d’expérimentation.

5. Bonnes pratiques CRO

Design upfront : valider le mécanisme de split sur un environnement de staging avec des logs complets.
Idempotence user_id : garantir un identifiant unique et stable pour la randomisation.
Exclusions symétriques : appliquer les mêmes filtres avant la randomisation pour tous les groupes.
Logging exhaustif : stocker attribution, timestamp, user_id, groupe et motif d’exclusion pour diagnostic.

En bref : l’erreur SRM est le « check santé » incontournable d’un test A/B. Sans randomisation fiable, même la meilleure analyse statistique ne vaut rien. Un monitoring SRM rigoureux protège la validité scientifique et la crédibilité de votre programme d’expérimentation.

Devenez expert en CRO !

Soyez reconnu et rejoignez le top 1% des experts CRO Français grâce à une méthode structurée pour déployer un programme d'expérimentation impactant.

Découvrir le programme

Mathieu Fauveaux

Sample Ratio Mismatch (Erreur SRM)

1. Définition formelle

2. Causes courantes

3. Conséquences

4. Détection et réactions

5. Bonnes pratiques CRO

Devenez expert en CRO !

FWO

Services formation CRO

Workshop CRO & services

Consultant CRO indépendant

FWOptimisation © Tout droits réservés 2019

Mentions légales

Politique de confidentialité