Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
La Question des Vaccins
28 février 2014

Le paradoxe de Simpson en statistiques médicales : un match de Coupe Davis !


 Les mystères "impénétrables" du paradoxe de Simpson ! Extraits ( [5])  :

 

"Un bon paradoxe est un paradoxe dont on ne réussit jamais à se débarrasser. Quand vous croyez en avoir trouvé la clef, une remarque vous fait découvrir que rien n'est résolu. Les paradoxes de Zénon à propos de l'impossibilité du mouvement sont de tels paradoxes.

Mais le plus élémentaire de tous est le paradoxe de Simpson dont on imagine des solutions... qui conduisent à d'autres paradoxes !

 Sans cesse, des scientifiques et des utilisateurs de statistiques tombent dans les pièges qu'il tend.

 Chaque année, paraissent des articles qui tentent de déterminer son sens profond et la façon dont on doit le traiter.

 Malgré cette littérature abondante, il n'est pas certain que l'on détienne une solution entièrement satisfaisante pour se libérer de cette récalcitrante absurdité."

 

DIABLE !!! Qu'y-a-t-il de si mystérieux derrière cela ? Voyons  :

 

Ce qu'on appelle le paradoxe de Simpson a en particulier été observé au cours d'une expérimentation médicale réelle [1] où 2 traitements A et B ont été testés contre les calculs rénaux.

Je me suis amusé à présenter cela comme un tournoi de Coupe Davis entre 2 pays A et B. Le premier jour il y a les 2 matchs en simples où on teste séparément l'efficacité des traitements A et B contre les petits calculs rénaux et les gros calculs. Les résultats des 2 matchs sont sans appel, A bat largement B.

Il y a donc eu 81 succès pour 87 traités par A soit 93% de succès ...

Calculs rénaux

Traitement A

Traitement B

Coupe Davis !

Petits calculs

81/87 =93%

234/270=87%

A bat B en simple !

Gros  calculs

192/263=73%

55/80=69%

A bat B en simple !

Somme

273/350=78%

289/350=83%

B bat A en double !

Gros effectifs

192/263=73%

234/270=87%

B bat A en simple !

Petits effectifs

81/87 =93%

55/80=69%

A bat B en simple !



Le lendemain les mêmes joueurs se rencontrent en double. Tout le monde s'attend à voir A triompher aisément de B. Surprise, c'est B qui gagne !

C'est cela le paradoxe de Simpson.

Comme tout paradoxe il a une explication qui apparaît aisément au troisième jour du tournoi, avec les 2 derniers simples. Le premier jour c'étaient le meilleur joueur de A qui avait affronté et battu le meilleur joueur de B puis le moins bon joueur de A qui avait battu le moins bon joueur de B.

Pour les derniers simples, le meilleur joueur de B rencontre le moins bon de A et c'est B qui gagne. En fait, ce match est celui des gros effectifs : 263 malades traités par A contre 270 par B. Il y en a plus de 3 fois plus que pour les petits effectifs, 87 pour A et 80 pour B. Aussi, selon la règle démocratique, les gros effectifs imposent leur force aux petits. Or la bataille des gros effectifs a été gagnée par B. Aussi, il est logique et non paradoxale que B l'ait emporté en double quand les effectifs étaient cumulés.

On peut trouver un autre exemple [2] de ce paradoxe, complètement fabriqué cette fois ci (voir page 234 du lien). C'est une histoire où l'on compare les succès des garçons et des filles au baccalauréat alors qu'ils sont issus de 2 lycées A et B. C'est le même principe, les gros effectifs sont dans le lycée A pour les garçons et dans le B pour les filles. Cet exemple est appelé "Barouf à Bombach !"

Pour ces 2 exemples, les auteurs ne proposent aucune explication au paradoxe.

J'en avais d'ailleurs proposé récemment un exemple du même genre alors que j'ignorais que cela s'appelait le paradoxe de Simpson. C'était avec des pièces de 1 et 2 euros de fabrications française et allemande :

Comparaison de deux proportions : un fort risque d'occulter un signal ! [3]

Quand on sait que le test par l'odds ratio est une comparaison  de 2 proportions et que l'on fonde des décisions très importantes de santé publique sur ces tests on peut avoir peur !

 

 

Que montre, non pas le paradoxe de Simpson, mais l'incroyable agitation autour de lui ?

Car c'est bien ce phénomène humain et sociologique qui retient mon attention (taper paradoxe de Simpson sur un moteur de recherche). Ce soi-disant paradoxe montre que les nombres ont des lois qui sont indépendantes de ce que les humains veulent  représenter par ces nombres. Que ce soient des malades qui guérissent ou des pièces qui tombent sur pile, les nombres s'en moquent complètement !

 

Pour l'exemple avec les calculs rénaux, remplaçons les petits calculs par une pièce de 1 euro, les gros calculs par une pièce de 2 euros, les traitements A ou B par des pièces de fabrication française ou allemande. Un malade qui guérit deviendra : la pièce est tombée sur pile. Conservant les mêmes résultats on aura donc obtenu 81 piles en lançant 87 fois une pièce française de 1 euro. Les constats seront les mêmes. Ils ne dépendent que des nombres et pas de ce qu'on a choisi de leur faire représenter. On voit donc que cette affaire n'a rien voir avec les statistiques qu'elles soient médicales, sociologiques ou autres.

 

Alors, à quoi est-elle dû ?

 

Les utilisateurs restent "collés" à leur discipline particulière, médecine ou sociologie par exemple.

Ils ne pensent à considérer que des situations ayant un sens dans leur discipline.

 

Ainsi, pour les médecins, la classification entre gros et petits effectifs n'ayant aucune signification médicale, ils ne pensent pas à la prendre en compte. En un mot, ils oublient de faire jouer les 2 derniers simples du troisième jour de la Coupe Davis ! Pourtant, ce sont ces matchs entre les gros effectifs d'une part et les petits effectifs d'autre part qui donnent la clé du problème, montrant qu'il n'y a aucun paradoxe particulier. Le troisième jour de la Coupe Davis est tout aussi important que le premier jour ou le double !

 De manière générale, on a un tableau à double entrée où importe peu ce que sont A, B, X et X'. Le couple (X , A) a été réalisé n fois avec x succès etc.

  Avoir x/n largement supérieur à y/m et x'/n' largement supérieur à y'/m' n'est pas incompatible avec avoir

(x+x')/(n+n') largement inférieur à (y+y')/(m+m')

Cela est facilité si y/m est largement supérieur à x'/n' et que m et n' sont beaucoup plus grands que m' et n.

 

 

A

B

X

x/n petits effectifs

y/m gros effectifs

X'

x'/n' gros effectifs

y'/m' petits effectifs

X+X'

(x+x')/(n+n')

(y+y')/(m+m')

Gros effectifs

x'/n'

y/m

Petits effectifs

x/n

y'/m'

 

Il n'y a aucun mystère dans cette affaire  !!!

On pourrait cependant m'objecter que je pars d'une situation décomposée avec, dans l'exemple initial, les petits et gros calculs rénaux. Mais si on part avec les données globalisées, comment penser à décomposer en petits et gros calculs plutôt qu'autrement ?

En fait, on confond comparaison de 2 proportions avec comparaison de 2 probabilités et j'ai développé cette question dans [3]. Très simplement, on a un lot de 100 pièces de 1 euros lancées chacune une fois et un lot de 100 pièces de 2 euros lancées de même. On veut comparer la probabilité p de tomber sur pile pour les pièces de 1 euro avec la probailité p' correspondante pour les pièces de 2 euros. Le problème est qu'avant de tester l'égalité p=p' avec les valeurs observées il faut d'abord se demander si p et p' existent ! Autrement dit se demander si chaque pièce de 1 euro a la même probabilité p de tomber sur pile et de même pour celles de 2 euros.

Sur l'exemple des calculs rénaux il faut se demander si chaque malade traité par A avait la même probabilité de guérison. De même pour ceux traités par B. Il faut donc explorer les données pour voir si on peut considérer que cela est réalisé. Cette probabilité de guérison pourrait dépendre du sexe, de l'âge, de la taille des calculs, de leur ancienneté etc. 

Le problème est donc aussi là : sur les données globales on compare 2 proportions qui ne correspondent pas forcément aux probabilités de guérison de chacun des malades.

On pourrait penser régler la question en ayant les mêmes proportions dans les 2 groupes. Comme je l'ai montré dans [3], cette condition est nécessaire mais pas suffisante. On en a ici une illustration :

Les proportions entre petits et gros calculs dans les 2 groupes A et B sont 87/263=33,1% et 80/270=29,63%. Elles sont très proches. Aussi, de faibles variations de ces nombres suffiraient pour les rendre pratiquement égales sans supprimer le paradoxe. Par exemple on a 84/266=31,58% et 84/267=31,46%.

Plus précisément encore, dans l'analyse des causes de ce paradoxe, il y a le fait que les probabilités de guérison sont très différentes selon qu'il s'agit de petits ou de gros calculs : pour A elles peuvent être estimées par 93% et 73%.

C'est cet écart considérable qui permet au traitement B de s'intercaler avec 87% de guérison pour les petits calculs.

C'est cela la cause fondamentale de ce paradoxe.

Les autres raisons ( B intercalé et différence importante d'effectifs) sont secondaires et ne pourraient jouer sans la première

 

[1] Wikipedia paradoxe de Simpson

http://fr.wikipedia.org/wiki/Paradoxe_de_Simpson

[2] Barouf à Bombach page 234

http://www.modulad.fr/archives/numero-33/tutorial-confais-33/confais-33-tutorial.pdf

[3] Comparer deux proportions : danger c'est risqué !

http://questionvaccins.canalblog.com/archives/2014/02/06/29133753.html

 

 

Voici d'autres sites présentant  le paradoxe de Simpson

 [4]  http://sciencetonnante.wordpress.com/2013/04/29/le-paradoxe-de-simpson/

[5]  http://www.pourlascience.fr/ewb_pages/a/article-l-embarrassant-paradoxe-de-simpson-31601.php

 [6]  http://www.lifl.fr/~delahaye/pls/236.pdf

 

Il y en a beaucoup d'autres …

 

Publicité
Publicité
Commentaires
B
Une discussion qui pourrait vous intéresser : "Autre grave défaut de Prescrire, sa méconnaissance de la règle qui veut que la véritable et honnête et intelligible expression d’un bénéfice ou d’un dommage se fait sous forme de la variation du risque absolu et non pas des outils de propagande que sont les rapports de vraisemblance ou des variations flatteuses de risque relatif. L’industrie pharmaceutique en fait autant pour vendre ses produits peu ou pas efficaces, un référence !" http://www.atoute.org/n/+Motilium-domperidone-on-se-calme+.html
Répondre
B
ça vous intéressera sans doute ( mais il faut payer pour accéder à la totalité de l'article) " Vaccine Safety Study as an Interesting Case of "Over-Matching"" http://www.intechopen.com/books/recent-advances-in-autism-spectrum-disorders-volume-i/vaccine-safety-study-as-an-interesting-case-of-over-matching-
Répondre
La Question des Vaccins
Publicité
Derniers commentaires
Archives
La Question  des Vaccins
Publicité