La Question des Vaccins

01 décembre 2014

Communiqué de presse conjoint Revahb-E3M

 

 

Communiqué de Presse du 1er décembre 2014

 

Les associations REVAHB, qui regroupe depuis 1997 les victimes d'effets indésirables survenus dans les suites d'une vaccination contre l'hépatite B, et E3M qui regroupe les personnes atteintes de myofasciite à macrophage, maladie neuromusculaire induite par les sels d’aluminium utilisés comme adjuvants vaccinaux, s’associent pour porter à votre connaissance la publication scientifique (en version française) du Dr Dominique LE HOUEZEC [1], parue le 14 novembre 2014 dans Immunologic Research, revue à comité de lecture [2] :


Evolution de la sclérose en plaques en France depuis le début de la vaccination contre l’hépatite B

Cette étude originale reprend, avec un recul de 20 années, les données chiffrées officielles concernant l'évolution de la sclérose en plaque en France. Elle suggère fortement un lien entre l’augmentation de cette affection et la campagne intensive de vaccination contre l'hépatite B menée dans notre pays dans les années 90 (environ 20 millions de personnes vaccinées sur un court laps de 4 années). Cette « expérimentation involontaire réalisée à grande échelle », portant sur le tiers de la population française, éclaire ce qui est parfois qualifié de problème franco-français.
Les conclusions du Dr LE HOUEZEC doivent inciter les autorités sanitaires à reconsidérer leur position sur les conséquences de la vaccination contre l’hépatite B :


« Les données chiffrées disponibles en France montrent donc un signal statistique certain en faveur d'un lien de causalité entre l’événement vaccin anti-HB et l'apparition de SEP, avec une corrélation maximale dans les deux années suivant la vaccination ».


Cette nouvelle étude vient enrichir les connaissances sur les effets indésirables induits par certains vaccins. Elle s’ajoute à plusieurs informations scientifiques diffusées en 2014 :


- Le 22 mai, lors du colloque organisé par l’OPECST [3] à l'Assemblée Nationale, le Pr BELEC (hôpital Européen Georges Pompidou) a confirmé les travaux du LEE (USA) :

« Entre 200 et 400 fragments d’ADN résiduels par ampoule de Gardasil. Ce n’est pas normal. Quelle est la signification ? Je ne sais pas. (…) Il faut absolument continuer les recherches sur ce sujet. Les interactions entre des résidus ADN et l’hydroxyphosphate d’aluminium, ce n’est de toute façon pas normal ».

 

- Le 3 juin, des chercheurs portugais publiaient leurs travaux sous le titre

« Myofasciite à macrophages et vaccination: Conséquence ou coïncidence? » [4].

Leur conclusion après avoir étudié une cohorte portugaise de 16 cas :

« Sur la base des données accumulées, cette affection à médiation immunitaire peut être déclenchée par l'exposition aux vaccins contenant de l'aluminium chez des patients avec antécédents génétiques spécifiques. »


Ces données scientifiques justifient amplement nos demandes exprimées depuis des années auprès des pouvoirs publics :


- La recherche doit bénéficier au plus vite de moyens financiers à la hauteur des enjeux. Ces recherches doivent être menées en toute indépendance et en toute transparence, de façon à ce que soit appréhendé au plus vite le processus de survenue de ces pathologies (scléroses en plaques et scléroses latérales amyotrophiques post-vaccinales, myofasciite à macrophages, encéphalomyélite aigüe disséminée …).


- Dans l’attente du résultat de ces recherches, le principe de précaution doit s’appliquer :


1-  des vaccins de base sans aluminium doivent être mis à disposition de la population ;


2-  aucune décision de généralisation concernant un vaccin avec aluminium ne doit être prise ;

3- l’injection de tout vaccin comportant un sel d’aluminium doit faire l'objet d'une étude attentive des antécédents familiaux et personnels du patient, et se faire dans des conditions parfaites de traçabilité.


Nous pensons aussi à toutes ces victimes, qui ont suivi les conseils des autorités sanitaires et dont la vie a été bouleversée ou qui en sont aussi parfois décédées. Une juste reconnaissance doit leur être accordée. Et lorsque nous parlons de reconnaissance, il s’agit tout à la fois de redonner de la dignité à ces personnes souvent écrasées par l’histoire de leur maladie, de leur faciliter un accès sans entrave à des soins appropriés et gratuits, de compenser les lourdes pertes financières subies au long de ces années.

Contacts :

REVAHB   http://www.revahb.fr/

E3M  – www.myofasciite.fr

 

[1] L’un des médecins conseils du REVAHB


[2] Version française ci-jointe - La version originale de cette publication est en libre accès, disponible sur le site du journal Immunologic Research (http://link.springer.com/article/10.1007%2Fs12026-014-8574-4), sous le titre de "Evolution of multiple sclerosis in France since the beginning of hepatitis B vaccination".


[3] Office Parlementaire d’Evaluation des Choix Scientifiques et Technologiques


[4] http://myofasciite.fr/Contenu/Divers/20140603_Santiago_MFM_Portugal_FR.pdf

Posté par BernardGue à 12:06 - - Commentaires [0] - Permalien [#]
Tags : ,


24 novembre 2014

Vaccination hépatite B et sclérose en plaques : une nouvelle étude "rassurante" mais ...

 

 Méta-analyse Langer-Gould

Une étude "rassurante" mais ... un risque significatif  oublié au delà d'un an  !

 

Une nouvelle étude, toute récente, (10 octobre 2014) portant sur le lien entre vaccination hépatite B et sclérose en plaques apparaît "rassurante" selon l'appréciation de notre président du CTV* Daniel Floret. Pourtant, elle pourrait contenir au moins un résultat significatif intéressant que les auteurs n'ont pas fait apparaître.

* CTV : Comité technique des vaccinations

Cette étude n'est pas en accès libre, seul le résumé [2] est librement disponible.

 

Voici d'abord ce qu'en dit [1] Daniel Floret, le président du Comité technique des vaccinations :

 

« Cette étude est très rassurante dans la mesure où elle démontre à 3 ans l'absence de lien entre toute vaccination et la révélation d'un ADSN*. Ce fait est notamment démontré pour les vaccins hépatite B et HPV .

*ADSN : atteinte démyélinisante du système nerveux

L'augmentation du risque de révélation d'une ADSN à proximité immédiate d'une vaccination (tous vaccins confondus) est une constatation intéressante : le fait que cette augmentation du risque disparaisse à distance va dans le sens d'une non responsabilité du vaccin dans la genèse de la maladie. Par contre, la stimulation immunitaire provoquée par le vaccin peut précipiter le passage d'une phase asymptomatique à une phase symptomatique de la maladie. Une maladie infectieuse peut avoir le même effet.

Cette hypothèse est en accord avec le fait démontré que l'apparition des premières manifestations de SEP* fait suite à un processus immunitaire et un processus de démyélinisation débuté depuis plusieurs années auparavant.

*SEP : sclérose en plaques

En somme, une étude rassurante de plus concernant la non responsabilité des vaccins dans la genèse des ADSN qui, outre sa qualité, apporte des éléments d'explication pour le lien temporel entre vaccination et révélation de la maladie. »

On peut lire aussi les commentaires de "Pourquoi Docteur".

Pour ne pas compliquer l'affaire je ne vais pas analyser ici cette publication dans ses différents aspects mais montrer le plus rapidement et le plus simplement possible qu'il existe effectivement un signal statistique que ni les auteurs ni les commentateurs ne semblent avoir vu.

 

Je résume et j'explicite ci-dessous un tableau de données et de résultats obtenus par les auteurs. Ils concernent l'apparition d'atteintes démyélinisantes du système nerveux (ADSN) dans les 3 ans qui suivent une vaccination hépatite B. Il a été retenu 780 cas pour 3885 témoins (5 par cas avaient été demandés soit 3900). Plusieurs délais ont été étudiés, de 42 jours à 3 ans pour cette vaccination.

 

L'odds ratio OR peut s'interpréter comme le risque relatif. Les auteurs donnent l'intervalle de confiance. A partir d'une de ses bornes et de l'OR j'ai pu retrouver l'écart-type utilisé puis calculer la probabilité associée au test, à savoir la probabilité d'obtenir un OR au moins aussi grand que celui observé. Cette probabilité explicite beaucoup mieux que l'intervalle de confiance l'importance de l'écart entre l'odds ratio OR observé et sa valeur moyenne attendue qui est 1 en l'absence d'actions autres qu'aléatoires.

 

Délai

42 jours

90

180

1 an

3 ans

Odds ratio OR

0,4

0,5

0,4

0,47

1,12

Probabilité

associée

80,61%

81,52%

91,79%

94,89%

30,76%

Intervalle confiance

[0,05 ; 3,24]

[0,11 ;  2,30]

[0,11 ; 1,40]

[0,19 ; 1,13]

[0,72 ; 1,73]

 

L'observateur est immédiatement frappé par le fait que OR, largement inférieur à 1 jusqu'à 1 an (0,47), devient supérieur à 1 pour un délai de 3 ans, soit 2 ans plus tard. L'écart mesuré par les probabilités, qui font intervenir les tailles des échantillons utilisés, est encore plus spectaculaire : on passe de 94,89% à 1 an à 30,76% à 3 ans.

 

On peut préciser cette inversion d'orientation par l'évolution des données entre  moins d'un  an et entre 1 et 3 ans. Le tableau ci-dessous reproduit les nombres de cas et de témoins* qui avaient été exposés à la vaccination hépatite B au cours de la première année précédant la première atteinte et dans les 3 années qui précédaient celle-ci.

* Pour les témoins, qui n'ont pas été atteints par la maladie, la date considérée est celle du cas auquel ils ont été associés.

25 cas sont donc apparus au cours des seconde et troisième année qui suivaient la vaccination contre 6 au cours de la première, soit 2 fois plus en moyenne chacune de ces 2 années qu'au cours de la première année :

 6 cas sur 1 an  pourrait donner 12 cas sur 2 ans contre 25 observés.

A vue cet écart devrait être considéré comme une première alerte sans s'occuper de son caractère non significatif.

 

Les auteurs calculent un odds ratio dit "ajusté'' qui demande de connaître le détail des données. Je ne peux donc le faire, aussi j'ai calculé directement OR et la variance par les formules classiques.

 

On voit que le résultat est significatif (0,73% < 2,5%) et devrait donc interpeller.

 

Le premier intérêt de ce résultat est qu'ils montre, contrairement à ce qu'affirment les auteurs et les commentateurs, que l'étude ne met pas seulement en évidence un risque à très court terme (moins de 30 jours, interprété comme signifiant que la démyélinisation avait déjà commencé et que la vaccination l'aurait seulement accélérée) mais que l'étude aurait pu aussi montrer un risque à plus long terme, au delà d'un an.

 

 

Délai

Cas exposés

Témoins exposés

OR direct

Test

OR ajusté

Test

1 an

6

56

OR= 0,53

92,94%

OR=0,47

94,89%

3 ans

31

127

OR=1,22

16,06%

OR=1,12

30,76%

De 1 an à 3 ans

31-6=25

127-56=71

OR=1,78

0,73%

Calcul Impossible 

 

On peut constater un phénomène analogue pour la sclérose en plaques (SEP) après vaccination hépatite B : jusqu'à 1 an les odds ratio relatifs aux différents délais sont largement inférieures à 1 (0,41 ; 0,26 ; 0,69) pour passer à 1,36 à 3 ans.

Pour la période entre 1 et 2 ans il a donc été observé 14 cas exposés contre 4 la première année. Le test avec un odds ratio direct (non ajusté) donne OR=2,01 avec la probabilité associée 1,42% significative.

 

 

Délai

Cas exposés

Témoins exposés

OR direct

Test

OR ajusté

Test

1 an

4

31

OR=0,64

79,82%

OR=0,69

74,60%

3 ans

18

66

OR=1,37

12,25%

OR=1,36

14,47%

De 1 an à 3 ans

14

35

OR=2,01

1,42%

Calcul impossible

 

 

Une simulation significative compatible avec les données


Il est possible de proposer une simulation compatible avec les données publiées donnant un écart largement significatif en faveur de la responsabilité du vaccin hépatite B dans l'apparition d'ADSN sur la période 3-4 ans après la vaccination.

On a observé 6 cas la première année et 25 au cours des 2 années suivantes. Je suppose que ces 25 cas se répartissent en 10 cas la seconde année et 15 la troisième. Les auteurs ne communiquent aucune donnée pour la quatrième année après la vaccination pour laquelle je suppose qu'il s'est aussi produit 15 cas. On aura ainsi 16 cas au cours des 2 premières années contre 30 pendant les 2 années suivantes :

 

Délai

De 0 à 1 an

De 1 à 2 ans

De 2 à 3 ans

De 3 à 4 ans

Cas

6

10

15

15

Cas sur 2 ans

                     16             simulation !

            simulation !             30        

 

Le nombre de cas observés au cours d'une période fixée, 2 ans par exemple, peut se modéliser par une loi de Poisson caractérisée par un seul paramètre qui est à la fois sa moyenne et sa variance.

Soit X et X' les variables aléatoires donnant le nombre de cas apparus au cours de la première et de la seconde période de 2 ans. X et X' sont supposées suivre des lois de Poisson de moyennes théoriques  u  et u'. Faisons l'hypothèse que u=u'. La variable aléatoire X'-X aura donc pour moyenne 0, sa variance étant la somme des variances de X et X', soit u+u'. Comme u et u' sont inconnues, on estimera u et u' par leurs valeurs observées 16 et 30. X'-X sera donc une variable aléatoire centrée (moyenne 0) et de variance estimée 46. Selon l'usage, et faute de pouvoir faire mieux, on l'approxime par la loi normale de moyenne 0 et de variance 46.

Sur l'observation X'-X prend la valeur 30-16=14. On peut alors calculer la probabilité  d'obtenir au moins 14 cas qui vaut 1,95% ce qui la rend significative au seuil habituel.

Les auteurs n'ayant publié aucune donnée au delà de 3 ans ni entre 1 et 3 ans, rien ne permet de dire que la simulation proposée ne serait pas la réalité. L'affirmation du président du CTV :

" le fait que cette augmentation du risque disparaisse à distance va dans le sens d'une non responsabilité du vaccin dans la genèse de la maladie."

n'est donc nullement prouvée : rien ne permet d'affirmer la disparition du risque au delà d'un an bien au contraire puisque entre 1 et 3 ans apparait une dynamique dont aucun élément publié par Langer-Gould ne permet d'affirmer ni qu'elle ne pourrait être significative sur une période bien choisie ni que cette dynamique ne  se poursuivrait pas au delà. Il ne s'agit donc pas d'un fait.

Pour Daniel Floret "cette étude montre qu'à échéance de trois ans après la vaccination il n'existe pas de lien statistique entre la vaccination contre l'hépatite B (OR 1,05 [0,72- 1,73])".

Les auteurs et commentateurs ont simplement oublié de s'intéresser aux cas apparaissant entre 1 et 2 ans et non pas seulement entre 0 et 3 ans ...

On peut proposer une autre simulation sur les 18 premiers mois et les 18 suivants :

Puisqu'il a été observé 3 cas au cours des 6 premiers mois et 3 au cours des 6 suivants, supposons qu'il y en ait eu encore 3 au cours des 6 mois qui ont suivi soit 9 cas au cours des 18 premiers mois. Il s'en serait donc produit 22 (31-9) au cours des 18 mois suivants. On peut alors comparer les 2 lois de Poisson de moyennes estimées 22 et 9. La différence est significative avec une probabilité 0,98% d'obtenir un écart au moins aussi important que celui observé (approximation par loi normale de moyenne 0 et de variance 31).

Parmi les commentaires "autorisés" sur l'étude Langer-Gould

Par exemple, selon "Pourquoi Docteur" [4] :

« Une nouvelle étude pourrait mettre un terme aux débats. Menée par le Dr Annette Langer-Gould, du consortium Kaiser Permanente basé à Pasadena dans la banlieue de Los Angeles, l'étude montre qu’il n’existe aucune relation à long terme entre le vaccin de l’hépatite B, du papillomavirus humain ou aucun autre vaccin et le risque de développer une sclérose en plaques, et ce jusqu’à trois ans après la vaccination.»

 

Ou encore par Daniel Floret :

« L'augmentation du risque de révélation d'une ADSN à proximité immédiate d'une vaccination (tous vaccins confondus) est une constatation intéressante : le fait que cette augmentation du risque disparaisse à distance va dans le sens d'une non responsabilité du vaccin dans la genèse de la maladie. Par contre, la stimulation immunitaire provoquée par le vaccin peut précipiter le passage d'une phase asymptomatique à une phase symptomatique de la maladie. Une maladie infectieuse peut avoir le même effet.

Cette hypothèse est en accord avec le fait démontré que l'apparition des premières manifestations de SEP fait suite à un processus immunitaire et un processus de démyélinisation débuté depuis plusieurs années auparavant. »

 

 Presque simultanément, une autre étude [3], en accès libre, était publiée le 14 novembre 2014. Elle est française et a été réalisée par le Docteur Dominique Le Houézec. Une de ses conclusions est qu'elle fait apparaitre un signal en faveur d'une relation entre vaccination contre l'hépatite B et l'apparition d'une ADSN, tout particulièrement dans les 2 années qui suivent cette vaccination.

Comme l'étude Langer-Gould ne publie pas de données intermédiaires entre 1 an et 3 ans, le résultat constaté ici reste en accord avec la conclusion de Dominique Le Houézec dont l'étude est maintenant disponible en français :

http://blog.myofasciite.fr/public/2014.11_Le_Houezec_-_SEP_post_Vacc_HB_-_V__Fr.pdf

 

[1] https://www.mesvaccins.net/web/news/6111-vaccinations-et-affections-demyelinisantes-du-systeme-nerveux-une-nouvelle-etude

[2] http://archneur.jamanetwork.com/article.aspx?articleid=1917549

[3] http://link.springer.com/article/10.1007/s12026-014-8574-4/fulltext.html

[4] 

http://www.pourquoidocteur.fr/Vaccination---le-lien-avec-la-sclerose-en-plaques-ecarte-8356.html

Pour "observer" la communication sur internet autour de la publication de Langer-Gould :

http://www.charlatans.info/news/Les-vaccins-n-augmentent-pas-le

 

Le résumé de l'étude par InfoVac :

« Une nouvelle étude (Langer-Gould JAMA Neurol. 2014 Oct 20) vient confirmer l’absence d’augmentation du risque de maladies démyélinisantes liées aux vaccinations. Cette étude cas-témoins réalisée en Californie a comparé une cohorte de 780 malades à 3880 témoins tous pris en charge par le système d’assurance maladie californien Kaiser Permanente Institute.

Aucune augmentation du risque jusqu’à 3 ans après la vaccination n’a été retrouvée avec les vaccins contre l’hépatite B (OR : 1.12; IC95% 0.72-1.73), HPV (OR : 1.05, IC 95%, 0.62-1.78) ou tout autre vaccin (OR, 1.03; IC 95% :0.86-1.22). Par contre, dans le mois suivant n’importe quelle vaccination, une légère augmentation de l’incidence est observée, suggérant que les vaccins pourraient accélérer la transition d’une maladie sub-clinique vers une maladie clinique chez les patients atteints de la maladie existante. »

 

 

http://devsante.org/actualites/vaccination-et-lesions-neurologiques

 

http://acadpharm.org/dos_public/Veille_scientifique_23.pdf

 

http://www.wikups.fr/vaccination_hepatite_b_et_sclerose_en_plaques_une_nouvelle_etude_rassurante_mais/e/433824

 

 

 

 

Posté par BernardGue à 21:33 - - Commentaires [0] - Permalien [#]
Tags : , ,

03 novembre 2014

Sclérose en plaques chez les enfants après vaccination hépatite B : Un signal statistique très fort !

 

Il est généralement admis que les études épidémiologiques qui portaient sur le lien éventuel entre la vaccination hépatite B et la sclérose en plaques (SEP) avaient conduit à affirmer qu'elles avaient montré l'absence de lien, autrement dit l'absence d'un signal statistique suffisamment fort et fiable en faveur d'un tel lien.

Il est au contraire possible de montrer aisément l'existence d'un signal particulièrement fort en faveur d'un tel lien.

Destinant cet article à un public non spécialisé dans la pratique des tests statistiques, je me suis attaché à essayer d'en assurer la compréhension.

 

Études sur les enfants.

L'équipe du professeur Marc Tardieu avait publié 3 études sur la SEP chez les enfants, 2 en décembre 2007 et une autre le 8 octobre 2008*. La première portait sur des enfants qui avaient été vaccinés après avoir eu une première atteinte démyélinisante centrale (ADC simple). Son objet était de voir si la vaccination hépatite B aurait pu favoriser son évolution en SEP. Pour les deux autres, les enfants avaient reçu cette vaccination alors qu'ils étaient indemnes d'une telle atteinte.

 

Deux questions se posent alors :

1- La vaccination aurait-elle pu favoriser l'apparition d'un certain nombre de premières atteintes démyélinisantes centrales (ADC simples) ?

 

2- La vaccination aurait-elle pu favoriser l'évolution en SEP d'un certain nombre d'ADC simples et qui le seraient restées ou ne seraient pas apparues sans cette vaccination ?

 

Le signal statistique très fort dont je me propose de montrer l'existence

porte sur la seconde possibilité.

 

Une image : on pourrait comparer le passage éventuel de l'ADC simple à la SEP à la transformation d'un essai au rugby. En anglais, la SEP est nommée ADC multiple. La sclérose en plaques pourrait donc être considérée comme une complication de l'ADC simple.

 

Tableau récapitulatif des données et des tests 

 

 

Vaccinés

Non Vaccinés

Total

Taux vaccinés

Test

SEP

80

63

143

55,95%

 

0,903/10000

ADC simples

74

132

206

35,92%

Total

154

195

349

44,13%

 

Taux SEP

51,95%

32,31%

40,97%

 

 

Test

0,923/10000

 

 

 

Ratio ADC/SEP

74/80=0,93

132/63=2,1

206/143=1,44

 

1,18/10000

 

Commentaires

Notons d'abord que le tableau est totalement déterminé par les 4 nombres 80, 63, 74 et 132.

On constate sur les lignes du tableau qu'il y a pratiquement 56% de vaccinés parmi les SEP contre 36% parmi les ADC simples. Cet écart de 20% paraît très important à vue. Le test statistique utilisé le confirme : moins d'une chance sur 10000 qu'un tel écart puisse apparaître par le seul fait du hasard. L'écart est très, très significatif d'une action autre que le hasard (niveau habituel du significatif : 2,5%).

 

On constate sur les colonnes du tableau qu'il y a 32,31% de SEP chez les non vaccinés contre 51,95% chez les vaccinés. Cet écart de près de 20% paraît lui aussi important. Il est lui aussi très, très significatif, le test correspondant donne moins d'une chance sur 10000 d'obtenir un tel écart par le seul fait du hasard.

 

Il ne faudrait cependant pas voir ce dernier résultat comme une confirmation. Le tableau le montre clairement : dans le premier cas on travaille sur les lignes et dans le second cas sur les colonnes du même tableau. Ce sont 2 façons différentes de lire les mêmes nombres. Il est donc logique d'obtenir le même résultat.

 

Il existe une troisième façon de présenter ces nombres : le ratio entre les ADC simples et les SEP. Il y a 0,93 ADC simples pour une SEP chez les vaccinés contre 2,1 chez les non vaccinés. Là aussi, l'écart à vue parait très important. Le test correspondant donne 1,18 chances sur 10000 d'observer un écart au moins aussi important par le hasard. 

La légère différence avec les tests précédents est liée au fait que la variance qui estime la dispersion par rapport à la moyenne, est moins bien estimée par ce procédé. Les 2 premiers tests donnent de ce fait des résultats plus fiables.

 

L'existence d'un signal paraît indiscutable.

Interprétation

Ce signal suggère que la vaccination hépatite B aurait favorisé l'évolution en SEP

d'ADC qui seraient restées simples ou ne seraient pas apparues

en l'absence de cette vaccination.

 

 

 

Confirmation par l'âge

Les auteurs donnent l'âge moyen des 143 SEP, soit 11,5 ans ainsi que celui de l'ensemble des ADC, c'est à dire le cumul des ADC simples et des SEP, soit 9,3. J'ai pu ainsi calculer l'âge moyen des ADC simples qui est 7,8 soit un écart de 3,7 ans entre les ADC simples et les SEP. Vu les âges moyens absolus 7,8 et 11,5, un tel écart paraît lui aussi très important. Il est essentiel de savoir que l'âge retenu est celui de la première atteinte, aussi les âges moyens des 2 groupes peuvent être comparés.

 

Il existe au moins 2 hypothèses permettant d'expliquer un tel écart :

1- Des enfants vaccinés à 11 ans en sixième ont pu faire leur première ADC à 13, 14, 15 ou 16 ans. Si, sous l'action de la vaccination elle avait évolué en SEP, ils viendront grossir le groupe SEP en apportant avec eux un âge élevé : l'âge moyen du groupe SEP va pouvoir croitre.

 

2- Si des ADC étaient des coïncidences, c'est à dire seraient apparues en l'absence de la vaccination, mais seraient restées simples sans cette vaccination, ces enfants vont quitter le groupe ADC simples dans lequel il se seraient trouvés sans cette vaccination. Ce groupe va donc perdre des effectifs d'âge élevé. L'âge moyen du groupe ADC simple va ainsi pouvoir décroitre.

 

L'écart important observé entre les âges moyens des 2 groupes pourrait permettre de valider au moins une de ces 2 hypothèses, sans qu'il soit possible, avec ces seules données, de pointer l'une plutôt que l'autre.

 

Estimations moyennes et minimales du nombre de SEP

pouvant être associées à la vaccination

 

Pour rendre les probabilités plus ''parlantes'' il est possible de les convertir en ''nombre de SEP pouvant être associées à la vaccination'' c'est à dire qui ne seraient pas apparues sans cette vaccination.

 

Une valeur moyenne peut être immédiatement obtenue : il suffit de transporter chez les vaccinés les 32,31% de SEP observées chez les 195 non vaccinés. Il faut cependant envisager 2 possibilités  :

 

1- Le vaccin n'a crée aucune ADC simple.

Valeur moyenne :

Si les 154 vaccinés ne l'avaient pas été, il y aurait eu encore 154 ADC parmi eux. Mais avec seulement 50 SEP au lieu de 80. Donc 50 SEP attendues en l'absence de vaccination hépatite B (32,31%). Soit 80-50=30 SEP qui n'étaient pas ''attendues''.

 

Valeur ''minimale'' :

La barrière habituellement fixée pour qualifier le test de significatif est 2,5%. La probabilité effectivement trouvée est 0,93/10000. On peut rechercher combien de SEP il suffisait d'avoir pour que le test devienne significatif :

 

Avec 65 SEP observée on aurait une probabilité test 2,89% > 2,5% non significative.

Avec 66 SEP observées la probabilité test devient 2,17%<2,5%, significative.

 

Avec 80 SEP observées, l'écart entre 2,5% et 0,93/10000 peut s'exprimer par 80-66=14 SEP pouvant être associées à la vaccination. C'est une valeur ''minimale'' associée à une probabilité. Elle n'est donc pas absolue.

 

2- Le vaccin a crée des ADC simples, par exemple 31. Si les 154 vaccinés ne l'avaient pas été il y aurait donc eu seulement 123 ADC.

 

Valeur moyenne :

On transporte les 32,31% de SEP chez les non vaccinés sur les 123, soit 40 SEP attendues. Soit 80-40=40 SEP non attendues et qui donc pourraient, en moyenne, être associées à la vaccination.

 

Valeur ''minimale''

Avec 53 SEP la probabilité test vaut 2,71% > 2,5% non significative

Avec 54 SEP elle vaut 1,94% <2,5%, significative.

 

80-54=26 SEP pouvant être associées à la vaccination, estimation ''minimale'' quand la vaccination a crée 31 ADC simples.

 

 

Une simulation pour les scléroses en plaques

Il a été retenue 143 SEP chez les 0-16 ans dont 101 chez les 10-16 ans. On sait que les 4 classes d'âge vaccinées en sixième au cours de la campagne d'octobre 1994 à juin 1998 l'ont été aux environs de 80% (75 à 82% selon l'étude de François Denis). Par contre, les enfants plus jeunes ont été vaccinés aux environ de 27% et les adolescents entre 40 et 50%. J'ai réalisé une simulation qui paraît compatible avec les données publiées et qui répartit les 101 SEP entre le groupe des ''sixièmes'' et celui des ''ados''. On constate qu'il est possible d'avoir 79% de vaccinés parmi les témoins associés aux ''sixièmes'' et 47,40% associés aux ''ados''.

 

 

" Sixièmes"

"Ados"

Au moins 10 ans

0 - 16 ans

Cas

68

33

101

143

Vaccinés ; taux

61  ;  89,71%

9  ;  27,27%

70

80

Témoins

479

289

765

1122

Vaccinés ; taux

375 ; 78,30%

135 ; 47,40%

512

609

Test binomial

0,31%

1,00%

31,42%

35,32%

Odds ratio OR non ajusté

OR Ajusté

2,35

0,42

1,12

1,07

1,10

Test sur OR non ajusté

Ajusté

1,98%

1,59%

31,62%

35,32%

33,48%

 

Résultats : les écarts entre les taux de vaccinés parmi les cas et les témoins paraissent très important : 89,71% contre 78,30% pour le groupe des "sixièmes" et 22,27% contre 47,40% chez les "ados". Plus précisément, les tests statistiques montrent que le groupe des ''sixièmes '' est significatif côté vaccin ''dangereux'' ( 0,31% de chances d'observer un écart au moins aussi grand par le test binomial de comparaison de 2 proportions ; l'odds ratio OR=2,35 (non ajusté) avec la probabilité associée 1,98% < 2,5%). Par contre, le groupe des ''ados'' est significatif côté vaccin ''protecteur'' (1,00% par le test binomial ; OR=0,42  (non ajusté) avec la probabilité associée 1,59% < 2,5%).

Par contre, le cumul des résultats fait disparaître les aspects significatifs (31,42% par le test binomial ; OR=1,12 avec la probabilité associée 31,62%). Pour les tests sur les données globales, le test binomial et l'odds ratio non ajusté donnent exactement la même probabilité 35,32%. Les différences observées entre le test binomial et celui de l'odds ratio sont liées, pour l'essentiel, au fait que l'estimateur de la variance est sans biais pour le test binomial et asymptotique pour celui de l'odds ratio.   J'ai comparé ce test avec celui de l'odds ratio dans cet article [1]. Il apparaît que le test binomial est plus fiable.

Remarque : sur cet exemple on constate que les écarts des probabilités tests sont très faibles entre le test ajusté (33,48%) et non ajusté (35,32%).

On pourrait s'étonner qu'un vaccin puisse favoriser la SEP quand on vaccine à 11 ans et en protéger quand on vaccine à 14-15 ans. En réalité, seuls étaient retenus dans l'étude ceux qui avaient fait une première ADC à au plus 16 ans. Ils étaient alors suivis jusqu'au 30 juin 2006 pour observer une éventuelle conversion en SEP. Un adolescent vacciné à 14-15 ans avait peu de temps devant lui pour faire sa première atteinte avant la limite des 16 ans. S'il l'a faisait plus tard à 17 ans, 18 ans, il n'était plus retenu dans l'étude. Il pouvait avoir ainsi été ''protégé'' d'une SEP non par la vaccination mais par la barrière à 16 ans !

 

C'est pourquoi le groupe des ''ados'' pourrait tout à fait être orienté vaccin ''protecteur'' au niveau de l'étude, le groupe des ''sixièmes '' pouvant alors être orienté vaccin ''dangereux''.

 

Si une pièce de 1 euro est déséquilibrée du côté des piles et une pièce de 2 euros du côté des faces, le cumul de résultats de jets de ces pièces pourrait gommer les orientations déséquilibrées des 2 pièces.

L'existence d'une telle situation pourrait être confirmée ou infirmée sur les données de l'étude, s'il était possible d'y avoir accès.

 

Annexe I

Les cas exclus pourraient-ils ''tuer'' le signal ?

Il avait été observé 403 ADC dont 54 avaient été exclues pour raison de statut vaccinal douteux. Les auteurs considèrent que les données étaient pratiquement exhaustives. Il est vrai qu'aux âges considérés les enfants étaient scolarisés et que, dans ces conditions, une ADC avait peu de chance de passer inaperçue. Parmi les 349 ADC retenues il y avait 143 SEP alors que 21 avaient été exclues. Parmi les 54 ADC exclues il devait donc y avoir 33 ADC simples et 21 SEP.

 

Le signal trouvé pourrait s'affaiblir si un grand nombre de ces 21 SEP avaient été non vaccinées alors qu'au contraire, beaucoup des 33 ADC simples l'étaient. Pour préciser ce point, j'ai appliqué à ces 21 SEP et 33 ADC simples les proportions de vaccinés constatées parmi les 143 SEP et les 206 ADC simples retenues. Puis j'ai pris la borne inférieure d'un intervalle de confiance à 95% pour les 21 SEP, soit 7, ainsi que la borne supérieure pour les 33 ADC simples, soit 21. J'ai donc retenu une proportion de 33,3% de vaccinés parmi ces 21 SEP alors que cette proportion vaut 56% parmi les 143. J'ai aussi pris 21/33=63,64% de vaccinés parmi ces 33 ADC simples alors qu'il y a seulement 36% de vaccinés parmi les 206 ADC simples étudiées. On voit que les marges paraissent généreuses.

Ainsi, parmi les 143+21=164 SEP on aura 80+7=87 SEP qui étaient chez des enfants vaccinés alors que parmi les 206+33=239 ADC simples il y aura 74+21=95 vaccinés. La probabilité associée au test, c'est à dire la probabilité d'obtenir un écart au moins aussi important que celui observé, est 4,12/1000=0,412% qui reste encore très significative (<0,5%). Niveau usuel du significatif : 2,5%.

On voit que le signal se maintient malgré des hypothèses défavorables.

 

Annexe II

 Comment j'ai réalisé le calcul des probabilités annoncées

 Faisons le calcul sur les colonnes. Dans le groupe des vaccinés la probabilité p d'évolution d'une ADC simple en SEP peut être estimée par 80/154=51,95% alors que la probabilité p' correspondante chez les non vaccinés est estimée par 63/195=32,31%.

On veut tester si on peut accepter p=p'. Le test le plus fiable est le test binomial de comparaison de 2 proportions avec un estimateur sans biais de la variance. J'ai consacré au moins un article [2] à cette question. Je retiens ici la formule (dont j'ai donné une démonstration) : 

 

 

On obtient un estimateur sans biais W de la variance en prenant :

W=(X/n)*(1-X/n)/(n-1) + (X'/n')*(1-X'/n')/(n'-1)

où les variables aléatoires X et X' sont binomiales B(n ; p) et B(n' ; p').

 

Sur l'exemple X désigne la variable aléatoire donnant le nombre de SEP parmi les n=154 vaccinés et X' la variable aléatoire donnant le nombre de SEP parmi les n'=195 non vaccinés. X et X' prennent les valeurs 80 et 63. Aussi, l'estimateur sans biais W de la variance prend la valeur :

 

w=(80/154)*(1- 80/154)/153 + (63/195)*(1- 63/195)/194=2,7588/1000

 

La différence entre les 2 proportions est 80/154-63/195=0,1964

 

On calcule alors la probabilité d'obtenir une valeur au moins égale à l'écart observé 0,1964 en utilisant la loi normale de moyenne 0 (centrée) et de variance w. Calculée avec une machine ayant la loi normale implantée constructeur, on obtient  la probabilité :

 

0,92274/10000

 

< 0,93/10000 < 1/10000

 

L'approximation normale utilisée pour le calcul est de très bonne qualité car les valeurs np et n(1-p) sont suffiamment grandes : ici la plus petites de ces valeurs est 63 alors qu'on demande seulement qu'elle soit au moins égale à 10 ; de plus, les proportions ne sont pas du tout excentrées, proches de 0 ou de 1, mais au contraire proche de 50% (entre 32% et 56%. Ces conditions sont donc très favorables à la qualité du calcul de la probabilité.

Calculs simplifiés

On peut éviter de calculer la probabilité en mesurant l'écart observé par le  nombre d'écarts-type : on divise l'écart observé entre les proportions, soit 0,1964 par la racine carrée de la variance w, ce qu'on appelle l'écart-type et qui mesure la dispersion des données par rapport à la moyenne. On trouve 3,74 qui signifie qu'il y a 3,74 écarts-type entre les 2 proportions 80/154 et 63/195.

On peut alors utiliser une règle simple : la différence est déclarée significative si elle est d'au moins 2 écarts-type. Avec 2,6 écarts-type elle devient très significative. Ici il y a 3,74 écarts-type. C'est clair !

 

Annexe III

Sur l'estimateur le plus courant pour la variance

 

 

 

On obtient un estimateur avec biais V de la variance en prenant :

V=(X+X')/(n+n')*[1-(X+X')/(n+n')]/[1/n + 1/n']

où les variables aléatoires X et X' sont binomiales B(n ; p) et B(n' ; p').

 

 C'est l'estimateur le plus couramment utilisé. Il suppose p=p'. Si ce n'est pas le cas les conséquences peuvent être importantes. Cela dépend alors des valeurs numériques. Ici l'écart est faible : la probabilité trouvé avec cet estimateur est 1,06/10000 au lieu de 0,93/10000.

 

 

 

 

 * Pour les liens vers les études ou la définition de l'odds ratio voir mon article :

« Sclérose en plaques chez les enfants, des données très démonstratives »

http://questionvaccins.canalblog.com/archives/2011/03/18/20609338.html

 

[1] http://questionvaccins.canalblog.com/archives/2014/02/18/29247121.html

[2] http://questionvaccins.canalblog.com/archives/2014/02/09/29163341.html

 

 

 

 

Posté par BernardGue à 21:24 - - Commentaires [1] - Permalien [#]
Tags : ,

12 octobre 2014

Vaccinations obligatoires : maltraitance ou dérive sectaire ?

 

Dérive sectaire ou dérive parlementaire ?

On pourrait se poser sérieusement la question !

Mais lisez plutôt ...

 

Le jeudi 9 octobre 2014 un couple de parents comparaissait devant le tribunal correctionnel d'Auxerre pour avoir refusé la vaccination DTP pour leur fille âgée de 3 ans, leur fils de 15 mois n'ayant encore reçu aucun vaccin non plus.

« Les parents ont été signalés à la Protection maternelle et infantile par un pédiatre du centre hospitalier où ils avaient fait la visite des neuf mois de l'enfant. Le service du conseil général les avait d'abord convoqués avant de faire à son tour un signalement au parquet. 

Cette famille "parfaitement insérée, aux valeurs tout à fait traditionnelles", a un "sens très développé de la sécurité sanitaire et des doutes depuis des années sur les effets secondaires des vaccins et le caractère néfaste des adjuvants", explique son avocat. "Ils ne font pas dans l'anti-vaccin primaire, ils n'appartiennent à aucune structure, aucune secte", souligne Me Emmanuel Ludot. » [1]

Ou encore, à la télé :


Justice : des parents "anti-vaccin" comparaissent pour maltraitance [2]

 

Maltraitance ? Non ! Dérive sectaire !

 

Un petit tour sur le site les lois françaises, legifrance :

http://www.legifrance.gouv.fr/

Recherchez, parmi les lois, la loi n° 2007-293 du 5 mars 2007, date de signature, la date de publication étant le lendemain le 6 mars. Loi chargée de réformer la protection de l'enfance avec le code

NOR : SANX0600056L



« L’Assemblée nationale et le Sénat ont adopté,

Le Président de la République promulgue la loi dont la teneur suit : 



TITRE V

PROTECTION DES ENFANTS  CONTRE LES DÉRIVES SECTAIRES



Article 37

I. – Après le mot : « tutelle », la fin de l’article L. 3116-4 du code de la santé publique est ainsi rédigée :

« aux obligations de vaccination prévues aux articles L. 3111-2, L. 3111-3 et L. 3112-1 ou la volonté d’en entraver l’exécution sont punis de six mois d’emprisonnement et de 3 750 € d’amende. »

II. – Dans la première phrase du premier alinéa de l’article L. 3111-2 du même code, après les mots : « sont obligatoires », sont insérés les mots : « , sauf contre-indication médicale reconnue ».



Article L3111-2

Les vaccinations antidiphtérique et antitétanique par l'anatoxine sont obligatoires, sauf contre-indication médicale reconnue ; elles doivent être pratiquées simultanément. Les personnes titulaires de l'autorité parentale ou qui ont la charge de la tutelle des mineurs sont tenues personnellement responsables de l'exécution de cette mesure, dont la justification doit être fournie lors de l'admission dans toute école, garderie, colonie de vacances ou autre collectivité d'enfants.

Un décret détermine les conditions dans lesquelles sont pratiquées la vaccination antidiphtérique et la vaccination antitétanique.



Article L3116-4

Le refus de se soumettre ou de soumettre ceux sur lesquels on exerce l'autorité parentale ou dont on assure la tutelle aux obligations de vaccination prévues aux articles L. 3111-2, L. 3111-3 et L. 3112-1ou la volonté d'en entraver l'exécution sont punis de six mois d'emprisonnement et de 3 750 Euros d'amende.



Voilà pour le texte de loi.

Pour les débats parlementaires à l'origine de cet article pour le moins étonnant il faut aller sur le site de l'Assemblée Nationale [3]



Assemblée nationale

Compte rendu analytique officiel



2ème SÉANCE DU MERCREDI 10 JANVIER 2007

Séance de 21 heures 30
47ème jour de séance, 107ème séance
Présidence de M. Jean-Luc Warsmann
Vice-Président





M. le président.

Je suis saisi de deux amendements identiques, n°139 et 190.

La parole est à M. Georges Fenech, pour défendre l’amendement n° 139.

M. Georges Fenech. Les vaccinations sont obligatoires, mais, suivant la vaccination, les pénalités ne sont pas les mêmes.

Nous proposons de frapper des mêmes pénalités tous les refus de vaccination, c’est-à-dire six mois d’emprisonnement et 3 750 euros d’amende.

M. le président. La parole est à M. Claude Leteurtre, pour défendre l’amendement n° 190.

M. Claude Leteurtre. C’est le même.

M. le président. Quel est l’avis de la commission ?

Mme Valérie Pecresserapporteure. Défavorable parce que les peines nous paraissent trop lourdes pour un refus de vaccination.

M. le président. Quel est l’avis du Gouvernement ?

M. le ministre délégué à la sécurité sociale, aux personnes âgées, aux personnes handicapées et à la famille. Même position.

M. le président. La parole est à M. Claude Leteurtre.

M. Claude Leteurtre. Pour la transfusion sanguine, il était bien d’en rester où on en était parce que, concrètement, c’est très efficace.

S’agissant des vaccinations, la situation paraît actuellement confortable parce que, globalement, la majorité des gens sont vaccinés, mais il est clair que cela va devenir un enjeu majeur. Il ne faut absolument pas qu’il y ait des foyers de non vaccination car c’est extrêmement dangereux en termes de santé publique. Il serait donc raisonnable de retenir ces amendements.

M. le président. Je mets aux voix par un seul vote les amendements nos 139 et 190.

(Ces amendements sont adoptés.)

Suspension de séance demandée par le ministre délégué afin qu'il puisse déposer un amendement supprimant ce qui concernait les vaccinations et venait d'être voté comme il va l'expliquer :

ARTICLE 27

M. le président. Je suis saisi d’un amendement n° 3, tendant à supprimer l’article 27 adopté par l’Assemblée en première délibération.

La parole est à M. le ministre, pour soutenir cet amendement.

M. le ministre délégué à la sécurité sociale, aux personnes âgées, aux personnes handicapées et à la famille. Les amendements identiques nos 139 et 190, adoptés après l’article 17, sont devenus l’article 27, relatif aux obligations de vaccination.

Dans un élan généreux, l’Assemblée a adopté là une disposition qui, s’étendant à toutes les vaccinations, me paraît comporter un certain nombre d’inconvénients.

L’aggravation des sanctions pénales prévues par nos lois s’agissant du défaut de respect de la vaccination obligatoire me paraît dénuée de portée, car, depuis cinquante ans, les dispositions actuelles n’ont jamais été mises en œuvre par le juge. Si, lorsque la sanction est faible, les dispositions ne sont pas mises en œuvre, il y a peu de raison de penser qu’elles le seront si la sanction est plus forte.

Par ailleurs, le recours à la sanction pénale comme facteur d’incitation à la vaccination n’est peut-être pas la bonne méthode. Mieux vaut une politique de santé publique qui informe des parents et qui mobilise le corps médical chargé de vérifier le respect de cette obligation, notamment via le carnet de santé de l’enfant. M. Xavier Bertrand, ministre de la santé, met d’ailleurs en œuvre des campagnes d’information sur ce point.

C’est pourquoi le Gouvernement demande la suppression de l’article 27 voté par l’Assemblée en première délibération.

M. le président. Quel est l’avis de la commission ?

Mme Valérie Pecresserapporteure. La commission avait émis un avis défavorable aux amendements n°s 139 et 190, auxquels le président de la commission des affaires culturelles, familiales et sociales, Jean-Michel Dubernard, était, je le rappelle, extrêmement défavorable.

M. le président. La parole est à M. Georges Fenech.

M. Georges Fenech. Sur les raisons de cette absence de poursuites, que vous avez justement soulignée, monsieur le ministre, voilà ce qu’ont déclaré, lors de leur audition devant la commission d’enquête, M. Didier Houssin, directeur général de la santé, et son collaborateur, M. Bertrand Sachs : « Est-elle due à des présentations de certificats de complaisance ou de faux certificats de vaccination ? À l’indulgence des établissements concernés ? Au sentiment que le nombre minime de refus de vaccination n’est pas de nature à compromettre la protection générale de la collectivité ? »

De même, la commission d’enquête s’inquiète de l’absence de réaction de certains magistrats face à des refus parentaux de vaccination. Comment comprendre qu’un juge des enfants ne prenne aucune décision après avoir entendu des parents adeptes de la communauté Tabitha’s Place lui expliquer qu’en raison des risques que présentaient les vaccinations ils refusaient d’y soumettre leurs enfants ?

Monsieur le ministre, je ne sais pas si vos enfants sont vaccinés…

M. le ministre délégué à la sécurité sociale, aux personnes âgées, aux personnes handicapées et à la famille. Nous en venons, monsieur Fenech, à des questions d’ordre très personnel…

M. Georges Fenech. Monsieur le ministre, j’ai quatre enfants et ils sont vaccinés.

M. le ministre délégué à la sécurité sociale, aux personnes âgées, aux personnes handicapées et à la famille. …mais c’est bien volontiers que je vous répondrai qu’en tant que ministre et avant même de l’être, j’ai souhaité donner le bon exemple. Mes enfants – et j’en ai quatre, moi aussi – sont tous vaccinés. Ils ont même reçu leurs rappels ! (Sourires.)

M. Georges Fenech. M. le ministre ne sera donc pas poursuivi dans le cadre du nouveau dispositif. (Sourires.) Mais il s’agit d’être cohérent. Tous les défauts de vaccination sont punis par la loi : certains sont des infractions contraventionnelles, d’autres sont des délits. Il n’y a aucune raison de maintenir cette distinction. Les amendements adoptés en première délibération permettent de les mettre tous sur le même pied. Requalifier la contravention en délit montre la volonté de la représentation nationale de voir ce dispositif obligatoire respecté par les familles et sanctionné par la justice. Je maintiens ma position.

M. le président. La parole est à M. Richard Mallié.

M. Richard Mallié. Monsieur le ministre, j’ai bien écouté votre explication sur votre amendement tendant à supprimer l’article 27, mais je ne peux pas y souscrire.

Comme vient de l’expliquer M. Fenech, il s’agit de cas très spéciaux. Imaginez demain une épidémie de grippe aviaire – tout le monde sait que la pandémie est possible –, obligeant à vacciner tous les Français, y compris ceux qui vivent dans les campagnes les plus reculées. Si une communauté où les enfants ne vont pas à l’école – comme en ont rencontré M. Fenech et les membres de la mission – refusait la vaccination, que se passerait-il ?

Aujourd’hui, nous n’avons pas les moyens d’être coercitifs. Toutes les campagnes d’information, par le biais de l’Institut national de prévention et d’éducation pour la santé, ne serviront à rien : s’ils ne veulent pas se faire vacciner, s’ils ne veulent pas que leurs enfants le soient, ils ne le seront pas.

Or il s’agit d’un problème de santé publique. C’est pour cela que nous ne pouvons accepter ce que vous venez de dire, monsieur le ministre. J’en suis fort navré, même si vos quatre enfants sont vaccinés. Les trois miens l’ont été aussi…

Mme Valérie Pecresserapporteure. Les miens également !

M. Richard Mallié…tout comme ceux du rapporteur.

M. le ministre délégué à la sécurité sociale, aux personnes âgées, aux personnes handicapées et à la famille. Je vous en félicite.

M. Richard Mallié. Mais, malheureusement, ce n’est pas le cas de tous.

M. le président. La parole est à M. Claude Leteurtre.

M. Claude Leteurtre. J’ai déjà plaidé en ce sens. Comme vient de le dire M. Mallié, il s’agit d’un problème de santé publique. Nous n’avons plus le droit de jouer, la situation peut devenir grave et l’allusion à la pandémie aviaire est d’actualité. Pensons à la typhoïde, au tétanos, qui redémarre, à la coqueluche. Soyons cohérents.

M. le président. Je mets aux voix l’amendement n° 3.

(L’amendement n’est pas adopté.)

Mme Patricia Adam. Seule Mme Pecresse, par solidarité sans doute, a voté l’amendement de M. le ministre.



[1] http://www.lexpress.fr/actualite/societe/sante/pourqui-certains-parents-decident-de-ne-pas-vacciner-leurs-enfants_1609788.html

[2] http://www.francetvinfo.fr/replay-jt/france-2/13-heures/video-justice-des-parents-anti-vaccin-comparaissent-pour-maltraitance_715473.html

[3] http://www.assemblee-nationale.fr/12/cra/2006-2007/107.asp#P53_706

 

Posté par BernardGue à 15:08 - Commentaires [0] - Permalien [#]

28 avril 2014

Étrange polémique autour de Bernard Bégaud

 

L'interview accordé le 9 avril 2014 à Libé [0] par Bernard Bégaud, pharmacologue réputé, va déclencher une violente réaction à son encontre de la part du professeur Alain Goudeau. Elle va s'exprimer sur le blog de Jean-Yves Nau, qui fut longtemps journaliste médical au Monde. Les titres sont très évocateurs :

 « Sclérose en plaques et vaccin contre l’hépatite B :

le Pr Bernard Bégaud accuse (Libération) mais n’en dit pas assez » [1]

  « Vaccin hépatite B et sclérose en plaques :

la réplique (mordante) du Pr Goudeau* au Pr Bégaud* » [2]

Mais pourquoi une telle attaque  émanant d'un tel confrère à l'encontre de Bernard Bégaud qui serait pressenti pour de hautes fonctions parisiennes selon JY Nau ?

 * Alain Goudeau, (Université François-Rabelais) chef du service de bactériologie-virologie du CHU de Tours

* Bernard Bégaud, professeur de pharmacologie à Bordeaux. Il dirige l’unité de recherche "Pharmaco-épidémiologie et évaluation de l’impact des produits de santé sur les populations" à l’Inserm.

Pour moi ce fut cette déclaration de Bernard Bégaud qui a mis le feu aux poudres :

 

«Ce qui a été le catalyseur et le déclencheur de cette méfiance, c’est le virus de l’hépatite B (VHB) et la polémique autour des cas de sclérose en plaques éventuellement induits par le vaccin.

On a menti et on a continué à mentir, volontairement ou non, pour la bonne cause.

Or, chaque fois que l’on ment, même et surtout avec une bonne intention,

on provoque une catastrophe. Et la suspicion s’installe. »

 

Le “ON” c’est qui ? La “BONNE CAUSE” c’est quoi ? 

Ce “ON” ce sont, sans nul doute, les différentes composantes de l’autorité en matière de vaccination “LA BONNE CAUSE” c’est la fameuse couverture vaccinale, notre nouvelle Ligne Maginot, l'obsession permanente de nos experts en santé publique qui confondent la lutte contre les virus avec la couverture vaccinale, la fameuse CV.

L’affirmation de Bernard Bégaud est très claire, elle signifie :

 

Si on dit la vérité, à savoir : il y a des cas de SEP liés à la vaccination 

(il fut très bien placé pour cela...),

on va casser la campagne de vaccination et perdre les bénéfices attendus de celle-ci.

 

C'est toujours le même raisonnement que dénonce en fait Bernard Bégaud  :

 

Le vaccin est inoffensif parce qu’il est utile.

Ou plutôt, puisque le vaccin est utile il devra être déclaré inoffensif.

 

Bernard Bégaud a manifesté à plusieurs reprises dans le passé son désaccord avec un tel raisonnement. Certains diront qu'il ne l'a pas exprimé avec une force suffisante. Malgré tout il l'a fait, c'était déjà beaucoup vu les fonctions qu'il occupait et mérite certainement le respect.

 

Le 30 juin 2009, France Culture a diffusé une émission sur la vaccination hépatite B au cours de laquelle Bernard Bégaud a annoncé qu'il préparait un livre sur le sujet avec un journaliste du Monde afin de rétablir l'histoire de cette affaire et d'apaiser sa Conscience. Il affirme avoir été soumis à des pressions sans préciser leur nature et surtout leur objet...

Il parle des obstructions rencontrées pour publier des études dès lors qu'elles n'étaient pas favorables au vaccin. La revue répond qu'elle n'a pas reçu le texte...On lui renvoie ... 10 fois ...  elle finit par répondre... que maintenant c'est trop tard pour publier...

Voir mon article La vaccination hépatite B sur France Culture le 30 juin

 Il me parait évident que ce fut cette affirmation dépourvue d'ambiguïté - le vaccin hépatite B a été responsable de scléroses en plaques, on le savait, on a menti et on continue de mentir - qui a mis le feu aux poudres à son encontre comme on peut le constater sur le blog de JY Nau.

Chanson de Guy Béart :

Le premier qui dit la vérité,

Il doit être exécuté.

D'ailleurs les critiques formulées par A. Goudeau sont très démonstratives d'une attaque très artificielle et pas toujours très régulière comme on va le voir.

Alain Goudeau :

« J’ai lu le texte de Bernard Bégaud qui est un assez joli exercice de réécriture de l’histoire. Les exemples d’informations erronées ou de contre vérités grossières sont les suivantes :

citant Bernard Bégaud : « C’est un gâchis énorme. Jusque dans les années 80, les Français étaient très attachés aux vaccins. Il me paraît clair que l’inversion est liée à la campagne de vaccination contre l’hépatite B lancée en 1994. »

Il lui répond : «Malheureusement l’activité anti-vaccinale pré-existe au vaccin contre l’hépatite B. Cette hostilité  se manifestait surtout contre le BCG et contre le vaccin anti-variolique. La France homéopathique nourrit depuis bien longtemps une violente diatribe contre les vaccins avec, en fond récurent, l’idée que tout ce qui change l’immunité "naturelle" affaiblit l’organisme. »

 Ce que Alain Goudeau a oublié de rapporter dans les propos de Bernard Bégaud, c'est ceci :

 « Certes, il existait déjà un courant méfiant, autour de concepts bio et nature, mais pas plus qu’en Allemagne. »

qui correspond au commentaire de A.Goudeau et anéantit sa critique de réécriture de l'histoire sur ce premier point.

 A. Goudeau va poursuivre son procédé d'occultation en rapportant ainsi les propos de B. Bégaud, qualifiés de grotesques :

 « Il y a eu une campagne massive à destination des nourrissons (…) »

qu'il commente ainsi :

« Il n’y pas eu de campagne chez les nourrissons en 1994 mais une campagne visant les pré-adolescents. Tout le monde s’accordait pour une extension aux nourrissons dès que les vaccins multivalents seraient prêts. »

 Voici pourtant ce qu'avait écrit B. Bégaud à ce sujet :

 « il y a eu une campagne massive à destination des nourrissons et des enfants de 10-11 ans. On a lancé cette campagne sans mettre en place de système de surveillance et d’information, sans se donner les moyens de savoir quels étaient les gens que l’on vaccinait, sans informer les médecins ni le public du pourquoi de la campagne, sans aucun message clair. Il aurait pourtant été simple de vérifier si la campagne de vaccination se déroulait comme prévu à destination des cibles choisies ; ce n’est que trois ans plus tard que l’on a noté que sur les 90 millions de doses consommées, les deux tiers avaient été utilisées pour des adultes, et non pour des nourrissons et des enfants. »

 Donc c'est très clair, il n'a jamais dit qu'on avait vacciné les nourrissons en masse MAIS qu'on avait eu l'intention de le faire, cet objectif n'ayant pu être atteint.

 De plus, A. Goudeau se trompe certainement quand il affirme qu'on attendait les hexavalents pour vacciner les nourrissons. Voici comment le site mesvaccins [3], pas vraiment antivaccinaliste, présente la chronologie des événements :

 « La chronologie des événements peut être résumée de la manière suivante. En 1993, l'Organisation mondiale de la santé recommande la vaccination universelle contre l'hépatite B. En décembre de la même année, le Conseil supérieur d'hygiène publique de France (CSHPF) et le Comité Technique des Vaccinations (CTV) recommandent cette vaccination en France pour les nourrissons, avec un rattrapage pour les adolescents âgés de 11 à 17 ans et pour les personnes à risques.

Une vaccination en milieu scolaire est annoncée fin juin 1994 pour la rentrée de septembre 1994, mais sans définition préalable d'une stratégie précise et argumentée. Une enquête réalisée en 1992-1994 montrait que 40 % des médecins n'étaient pas favorables à la vaccination des nourrissons, tandis que 97 % d'entre eux étaient favorables à la vaccination des adolescents. Mais les adolescents représentaient en 1994 une nouvelle population à vacciner dont les caractéristiques, mal connues, n'ont pas été suffisamment prises en compte. L'information sur la vaccination a été délivrée dans la précipitation aux médecins, au public et aux médias, avec une certaine dramatisation. Le nourrisson, normalement prioritaire, passait au second plan. Mal contrôlée, l'information a été prise en main par les laboratoires producteurs de vaccin qui, en rupture de stock au début de l'opération, avaient rapidement augmenté leur production. »

De plus, je pense avoir le souvenir qu'au cours de sa conférence de presse tenue le 1er octobre 1998, le secrétaire d’État à la santé Bernard Kouchner, tout en stoppant la vaccination dans les collèges, maintenait sa recommandation pour les nourrissons.



A. Goudeau cite et commente encore des propos tronqués de B. Bégaud :

« Il était attendu, normal, inévitable que l’on voie apparaître un certain nombre de cas de sclérose en plaques. »

« La survenue coïncidente des cas de sclérose en plaques (SEP)  ne pouvait pas être anticipée tout simplement parce que personne n’avait une idée de l’incidence de la SEP dans la population générale française. L’affirmation péremptoire de Bernard Bégaud  est grotesque et ne correspond pas à l’état de l’art de l’époque. Cette ignorance a d’ailleurs constituée une des difficultés majeures pour récuser les liens de causalité. »

 Voici les propos non tronqués de B. Bégaud sur ce point :

 «En ayant vacciné autant d’adultes, il était attendu, normal, inévitable que l’on voie apparaître un certain nombre de cas de sclérose en plaques (SEP). Et c’est ce qui s’est passé : on a vu des cas remonter, sans pouvoir savoir si c’étaient des coïncidences ou bien des SEP induites par le vaccin. »

Il y eut à l'époque une étude menée sur les données de la pharmacovigilance française. Elle fut pilotée par Annie Fourrier et Bernard Bégaud. Publiée en mai 2001 dans une revue britannique, elle comparait les cas notifiés constatés chez des adultes (20-44 ans) avec une estimation du nombre de cas attendus en l'absence de vaccination contre l'hépatite B. L'évaluation des cas attendus supposait que l'on puisse disposer d'une estimation acceptable de l'incidence annuelle de la sclérose en plaques. Cette estimation avait, à l'époque, été jugée suffisamment sérieuse pour mobiliser à 2 reprises (20 septembre 1998 et février 2000) plus de 40 experts internationaux venus à Paris pour discuter du lien possible entre la SEP et cette vaccination. Les comptes-rendus de ces réunions ne mentionnent nullement que l'estimation faite du nombre de cas attendus était dépourvue de toute valeur. Au contraire, ces experts avaient manifesté en 1998 le plus grand intérêt pour cette étude en cours et avaient demandé à être tenus informés de l'évolution des cas notifiés. Voir mes articles sur le sujet [4].

 De plus, Le Livre Blanc de la SEP mentionne, page 9 [5]:

 «La prévalence était estimée autour de 40/100.000, celle-ci semblant augmenter du Sud-Ouest au Nord-Est. Une des premières études nationales, menée à la suite d’une émission télévisée en mai 1986, les personnes atteintes de SEP étant invitées à compléter un questionnaire, estimait la prévalence française entre 30 et 40 pour 100.000 habitants. La seconde, publiée vers la même période (Fender et al., 1997), était fondée sur le registre de 128 bases de données des Caisses Primaires d’Assurance Maladie (CPAM), disponibles en 1994. Un échantillon, extrait des malades exonérés du ticket modérateur ...

 A cette période, le taux d’incidence n’a été, à notre connaissance, estimé que dans une seule étude (Moreau et al., 2000) concernant les 94.000 habitants de Dijon âgés de moins de 60 ans. Issue des fichiers des services du CHU et des cabinets des neurologues libéraux, cette incidence était évaluée à 4,3/100.000 habitants par an, ce qui apparaissait proche des taux rapportés dans d’autres villes d’Europe du Nord de même taille.

En conclusion, à la fin des années 1990, on estimait que la prévalence de la SEP en France se situait autour de 40 pour 100.000 habitants et l’incidence autour de 4 pour 100.000. »

 Quoiqu'on puisse penser de ces études, on ne peut qualifier leurs estimations de grotesque. De plus, ce sont ces valeurs qui ont été prises pour estimer les cas attendus dans  l'étude  de A. Fourrier et B. Bégaud.

 A. Goudeau poursuit ainsi ses attaques contre les affirmations de B. Bégaud, affirmations présentées, rappelons-le, dans une interview publiée dans un journal et non dans une revue scientifique :

« En clair, la polémique qui allait suivre n’aurait jamais existé si la campagne était restée dans les clous. Dans les pays où cela a été le cas, comme au Royaume-Uni et en Italie, il n’y a pas eu de cas de SEP, car il n’y a pas eu de vaccination massive des adultes. »

 « Prendre  la Grande -Bretagne et l’Italie comme des exemples de raisonnement sain est la preuve d’une double méconnaissance. L’Italie a, bien sûr, vacciné des adultes mais n’a pas eu de polémique. S’agit-il d’une  incidence plus faible de la SEP dans l’Europe du Sud ? Les autorités sanitaires italiennes sont-elles moins sensibles au poids de certains médias ? Est-ce l’absence, dans la capitale italienne, de neurologues hospitalo-universitaires de renom et omni-compétents ? L’enquête reste à faire.

Quant au Royaume-Uni, il n’a pas vacciné du tout et ce en dépit de sa forte population migrante. Cela évite, j’en conviens, bien des accidents post-vaccinaux. »

 Sauf que l'étude Hernan de 2004 portait sur des données britanniques, des adultes dont la moyenne d'âge était de 36 ans, le plus jeune en ayant 18, que 2,5% des témoins étaient vaccinés (ce qui est faible mais non nul), que cette étude était significative, que sa publication en septembre 2004 fit un bruit énorme, mobilisant tous les Comités nationaux et de l'OMS. Tous publièrent dans les plus brefs délais des avis critiques pour tuer le signal défavorable au vaccin. Cette polémique provoqua même une audition publique tenue le 9 novembre 2004 !!! A. Goudeau a l'air d'ignorer tout cela ...

 Alors, pourquoi toutes ces attaques contre Bernard Bégaud ? Attaques que Jean-Yves Nau qualifie de sévères et de réplique mordante. A bien y regarder, elles seraient plutôt un pétard mouillé où, mieux encore, un boomerang qui pourrait exploser dans les mains de son auteur..

C'est ce qui devrait fortement nous interpeller : pourquoi une telle réplique lancée avec des arguments aussi dangereux pour la crédibilité de son auteur ?

 La raison de cette réplique aussi précipitée qu'irréfléchie, je l'ai donnée au début de cet article. Elle a comme corolaire immédiat que si le public a été trompé sur la vaccination hépatite B, il pourrait l'être à nouveau avec d'autres vaccins, tout particulierement le Gardasil  et son petit frère le Cervarix?

 

 [0] http://www.liberation.fr/societe/2014/04/09/en-raison-de-devoiements-et-de-crises-mal-gerees-une-defiance-s-est-installee_994463

 

[1] http://jeanyvesnau.com/2014/04/10/sclerose-en-plaques-et-vaccin-contre-lhepatite-b-le-pr-bernard-begaud-accuse-mais-nen-dit-pas-assez/

 

[2] http://jeanyvesnau.com/2014/04/12/vaccin-contre-lhepatite-b-et-sclerose-en-plaques-la-severe-replique-du-pr-alain-goudeau-au-pr-bernard-begaud/

 [3] https://www.mesvaccins.net/web/news/5096 

 [4] http://questionvaccins.canalblog.com/archives/2008/09/26/10719582.html

 http://questionvaccins.canalblog.com/archives/2009/05/21/13813413.html voir  étude Fourrier-Costagliola, un étrange destin

 [5] http://www.aquisep.fr/sites/aquisep.cpm.aquisante.priv/files/LivreblancDEF.pdf

On peut aussi consulter avec intérêt ce document de 2011 réalisé par l'EHESP, l'Ecole des hautes études en santé publique :

http://documentation.ehesp.fr/memoires/2011/mip/groupe_9.pdf

 

Cet article a été repris par un blog animé par des pédiatres (pediablog) :

http://pediablogdlh.blogspot.fr/2014/04/vaccin-hepatite-b-polemique.html

ainsi que par Wikups :

http://www.wikups.fr/etrange_polemique_autour_de_bernard_begaud/e/80503

et aussi par paperblog reprenant la version de pediablog :

http://www.paperblog.fr/7116774/vaccin-hepatite-b-polemique-begaudgoudeau/

 

 

Posté par BernardGue à 10:43 - Commentaires [11] - Permalien [#]



28 février 2014

Le paradoxe de Simpson en statistiques médicales : un match de Coupe Davis !


 Les mystères "impénétrables" du paradoxe de Simpson ! Extraits ( [5])  :

 

"Un bon paradoxe est un paradoxe dont on ne réussit jamais à se débarrasser. Quand vous croyez en avoir trouvé la clef, une remarque vous fait découvrir que rien n'est résolu. Les paradoxes de Zénon à propos de l'impossibilité du mouvement sont de tels paradoxes.

Mais le plus élémentaire de tous est le paradoxe de Simpson dont on imagine des solutions... qui conduisent à d'autres paradoxes !

 Sans cesse, des scientifiques et des utilisateurs de statistiques tombent dans les pièges qu'il tend.

 Chaque année, paraissent des articles qui tentent de déterminer son sens profond et la façon dont on doit le traiter.

 Malgré cette littérature abondante, il n'est pas certain que l'on détienne une solution entièrement satisfaisante pour se libérer de cette récalcitrante absurdité."

 

DIABLE !!! Qu'y-a-t-il de si mystérieux derrière cela ? Voyons  :

 

Ce qu'on appelle le paradoxe de Simpson a en particulier été observé au cours d'une expérimentation médicale réelle [1] où 2 traitements A et B ont été testés contre les calculs rénaux.

Je me suis amusé à présenter cela comme un tournoi de Coupe Davis entre 2 pays A et B. Le premier jour il y a les 2 matchs en simples où on teste séparément l'efficacité des traitements A et B contre les petits calculs rénaux et les gros calculs. Les résultats des 2 matchs sont sans appel, A bat largement B.

Il y a donc eu 81 succès pour 87 traités par A soit 93% de succès ...

Calculs rénaux

Traitement A

Traitement B

Coupe Davis !

Petits calculs

81/87 =93%

234/270=87%

A bat B en simple !

Gros  calculs

192/263=73%

55/80=69%

A bat B en simple !

Somme

273/350=78%

289/350=83%

B bat A en double !

Gros effectifs

192/263=73%

234/270=87%

B bat A en simple !

Petits effectifs

81/87 =93%

55/80=69%

A bat B en simple !



Le lendemain les mêmes joueurs se rencontrent en double. Tout le monde s'attend à voir A triompher aisément de B. Surprise, c'est B qui gagne !

C'est cela le paradoxe de Simpson.

Comme tout paradoxe il a une explication qui apparaît aisément au troisième jour du tournoi, avec les 2 derniers simples. Le premier jour c'étaient le meilleur joueur de A qui avait affronté et battu le meilleur joueur de B puis le moins bon joueur de A qui avait battu le moins bon joueur de B.

Pour les derniers simples, le meilleur joueur de B rencontre le moins bon de A et c'est B qui gagne. En fait, ce match est celui des gros effectifs : 263 malades traités par A contre 270 par B. Il y en a plus de 3 fois plus que pour les petits effectifs, 87 pour A et 80 pour B. Aussi, selon la règle démocratique, les gros effectifs imposent leur force aux petits. Or la bataille des gros effectifs a été gagnée par B. Aussi, il est logique et non paradoxale que B l'ait emporté en double quand les effectifs étaient cumulés.

On peut trouver un autre exemple [2] de ce paradoxe, complètement fabriqué cette fois ci (voir page 234 du lien). C'est une histoire où l'on compare les succès des garçons et des filles au baccalauréat alors qu'ils sont issus de 2 lycées A et B. C'est le même principe, les gros effectifs sont dans le lycée A pour les garçons et dans le B pour les filles. Cet exemple est appelé "Barouf à Bombach !"

Pour ces 2 exemples, les auteurs ne proposent aucune explication au paradoxe.

J'en avais d'ailleurs proposé récemment un exemple du même genre alors que j'ignorais que cela s'appelait le paradoxe de Simpson. C'était avec des pièces de 1 et 2 euros de fabrications française et allemande :

Comparaison de deux proportions : un fort risque d'occulter un signal ! [3]

Quand on sait que le test par l'odds ratio est une comparaison  de 2 proportions et que l'on fonde des décisions très importantes de santé publique sur ces tests on peut avoir peur !

 

 

Que montre, non pas le paradoxe de Simpson, mais l'incroyable agitation autour de lui ?

Car c'est bien ce phénomène humain et sociologique qui retient mon attention (taper paradoxe de Simpson sur un moteur de recherche). Ce soi-disant paradoxe montre que les nombres ont des lois qui sont indépendantes de ce que les humains veulent  représenter par ces nombres. Que ce soient des malades qui guérissent ou des pièces qui tombent sur pile, les nombres s'en moquent complètement !

 

Pour l'exemple avec les calculs rénaux, remplaçons les petits calculs par une pièce de 1 euro, les gros calculs par une pièce de 2 euros, les traitements A ou B par des pièces de fabrication française ou allemande. Un malade qui guérit deviendra : la pièce est tombée sur pile. Conservant les mêmes résultats on aura donc obtenu 81 piles en lançant 87 fois une pièce française de 1 euro. Les constats seront les mêmes. Ils ne dépendent que des nombres et pas de ce qu'on a choisi de leur faire représenter. On voit donc que cette affaire n'a rien voir avec les statistiques qu'elles soient médicales, sociologiques ou autres.

 

Alors, à quoi est-elle dû ?

 

Les utilisateurs restent "collés" à leur discipline particulière, médecine ou sociologie par exemple.

Ils ne pensent à considérer que des situations ayant un sens dans leur discipline.

 

Ainsi, pour les médecins, la classification entre gros et petits effectifs n'ayant aucune signification médicale, ils ne pensent pas à la prendre en compte. En un mot, ils oublient de faire jouer les 2 derniers simples du troisième jour de la Coupe Davis ! Pourtant, ce sont ces matchs entre les gros effectifs d'une part et les petits effectifs d'autre part qui donnent la clé du problème, montrant qu'il n'y a aucun paradoxe particulier. Le troisième jour de la Coupe Davis est tout aussi important que le premier jour ou le double !

 De manière générale, on a un tableau à double entrée où importe peu ce que sont A, B, X et X'. Le couple (X , A) a été réalisé n fois avec x succès etc.

  Avoir x/n largement supérieur à y/m et x'/n' largement supérieur à y'/m' n'est pas incompatible avec avoir

(x+x')/(n+n') largement inférieur à (y+y')/(m+m')

Cela est facilité si y/m est largement supérieur à x'/n' et que m et n' sont beaucoup plus grands que m' et n.

 

 

A

B

X

x/n petits effectifs

y/m gros effectifs

X'

x'/n' gros effectifs

y'/m' petits effectifs

X+X'

(x+x')/(n+n')

(y+y')/(m+m')

Gros effectifs

x'/n'

y/m

Petits effectifs

x/n

y'/m'

 

Il n'y a aucun mystère dans cette affaire  !!!

On pourrait cependant m'objecter que je pars d'une situation décomposée avec, dans l'exemple initial, les petits et gros calculs rénaux. Mais si on part avec les données globalisées, comment penser à décomposer en petits et gros calculs plutôt qu'autrement ?

En fait, on confond comparaison de 2 proportions avec comparaison de 2 probabilités et j'ai développé cette question dans [3]. Très simplement, on a un lot de 100 pièces de 1 euros lancées chacune une fois et un lot de 100 pièces de 2 euros lancées de même. On veut comparer la probabilité p de tomber sur pile pour les pièces de 1 euro avec la probailité p' correspondante pour les pièces de 2 euros. Le problème est qu'avant de tester l'égalité p=p' avec les valeurs observées il faut d'abord se demander si p et p' existent ! Autrement dit se demander si chaque pièce de 1 euro a la même probabilité p de tomber sur pile et de même pour celles de 2 euros.

Sur l'exemple des calculs rénaux il faut se demander si chaque malade traité par A avait la même probabilité de guérison. De même pour ceux traités par B. Il faut donc explorer les données pour voir si on peut considérer que cela est réalisé. Cette probabilité de guérison pourrait dépendre du sexe, de l'âge, de la taille des calculs, de leur ancienneté etc. 

Le problème est donc aussi là : sur les données globales on compare 2 proportions qui ne correspondent pas forcément aux probabilités de guérison de chacun des malades.

On pourrait penser régler la question en ayant les mêmes proportions dans les 2 groupes. Comme je l'ai montré dans [3], cette condition est nécessaire mais pas suffisante. On en a ici une illustration :

Les proportions entre petits et gros calculs dans les 2 groupes A et B sont 87/263=33,1% et 80/270=29,63%. Elles sont très proches. Aussi, de faibles variations de ces nombres suffiraient pour les rendre pratiquement égales sans supprimer le paradoxe. Par exemple on a 84/266=31,58% et 84/267=31,46%.

Plus précisément encore, dans l'analyse des causes de ce paradoxe, il y a le fait que les probabilités de guérison sont très différentes selon qu'il s'agit de petits ou de gros calculs : pour A elles peuvent être estimées par 93% et 73%.

C'est cet écart considérable qui permet au traitement B de s'intercaler avec 87% de guérison pour les petits calculs.

C'est cela la cause fondamentale de ce paradoxe.

Les autres raisons ( B intercalé et différence importante d'effectifs) sont secondaires et ne pourraient jouer sans la première

 

[1] Wikipedia paradoxe de Simpson

http://fr.wikipedia.org/wiki/Paradoxe_de_Simpson

[2] Barouf à Bombach page 234

http://www.modulad.fr/archives/numero-33/tutorial-confais-33/confais-33-tutorial.pdf

[3] Comparer deux proportions : danger c'est risqué !

http://questionvaccins.canalblog.com/archives/2014/02/06/29133753.html

 

 

Voici d'autres sites présentant  le paradoxe de Simpson

 [4]  http://sciencetonnante.wordpress.com/2013/04/29/le-paradoxe-de-simpson/

[5]  http://www.pourlascience.fr/ewb_pages/a/article-l-embarrassant-paradoxe-de-simpson-31601.php

 [6]  http://www.lifl.fr/~delahaye/pls/236.pdf

 

Il y en a beaucoup d'autres …

 

Posté par BernardGue à 14:11 - Commentaires [2] - Permalien [#]

25 février 2014

Intervalle de confiance et test par l'odds ratio dans les études cas-témoins

 

 

On a vu dans les articles précédents [1], [2] et [3] que le test associé aux études cas-témoins consistait à comparer 2 proportions, celles des cas exposés (vaccinés par exemple) avec celle des témoins exposés au même facteur (vaccinés ).

Pour que les tests puissent être pratiqués dans les meilleures conditions, on a vu qu'il fallait que les cas vaccinés et les témoins vaccinés suivent des lois binomiales B(n ; p) et B(n' ; p'). On teste alors l'égalité entre p et p'. On a vu que des difficultés apparaissent dès que cette situation n'est plus réalisée car les tests s'appuient sur l'expression binomiale des variances, à savoir np(1-p) et n'p'(1-p') y compris la variance pour l'odds ratio qui est en relation avec l'expression :

1/np(1-p) +1/n'p'(1-p')

On a vu aussi que quand les cas et les témoins se partagent entre 2 groupes où les taux d'exposition (de vaccination) sont assez différents pour ne pas pouvoir être assimilables à des variations aléatoires, il est essentiel que les nombres moyens de témoins par cas soient les mêmes dans les 2 groupes.

Cependant, l'odds ratio utilisé dans les études épidémiologiques est l'objet de corrections sous la forme d'ajustements par régression logistique sur certains facteurs comme l'âge, le sexe ou la région. Il faudra donc se demander si ces ajustements pourraient corriger les biais qui apparaissent quand les conditions ne sont pas les plus favorables. Pour un glossaire de vocabulaire et de définitions on peut consulter ce glossaire médical [4] ou encore l'épidémiologie pour les nuls [4bis].

 

Nous verrons que ces ajustements semblent avoir pour effet de dispenser les auteurs des études de dissocier les données quand cela s'imposerait pourtant. Une conséquence sera que des signaux significatifs intéressants peuvent se trouver neutralisés alors qu'ils seraient apparus par une dissociation adéquate. La conclusion sera que la dissociation, quand elle est justifiée, prime l'ajustement qui peut bien entendu se faire ensuite sur chacune des parties issues de la dissociation.

EXEMPLE 1

On pourrait régler assez simplement et rapidement la question que je viens de poser. Supposons 50 cas dont 40 sont vaccinés avec 4 témoins par cas soient 200 témoins dont 100 vaccinés. L'odds ratio vaut 4 avec une variance estimée

1/40+1/10+1/100+1/100=0,145.

Le test par l'odds ratio donne 1,36/10000 qui est très, très significatif.

Supposons maintenant 50 autres cas dont 10 vaccinés avec 200 témoins dont 100 vaccinés. L'odds ratio relatif à la vaccination vaut 1/4 avec la même variance 0,145. Côté opposé, le test donnera la même probabilité car on compare le logarithme de l'odds ratio avec 0 et on sait que

ln(1/4)= - ln(4)

Le premier groupe était constitué de personnes âgées et le second d'enfants. Ayant regroupé les données pour former un groupe de 100 cas avec 400 témoins associés, le nombre de vaccinés sera 50 chez les cas et 200 chez les témoins Aussi l'odds ratio associé vaudra 1 : (50/50)/(200/200)

Il paraît clair que pour décrire une situation aussi contrastée il n'y aura pas d'autre alternative que de dissocier les 100 cas et 400 témoins en 2 groupes, les personnes âgées et les enfants. Il devrait donc paraître clair qu'il ne suffira pas de pratiquer un ajustement logistique conditionnelle associé à l'âge qui ne fournira qu'un seul odds ratio et un seul test par l'intervalle de confiance selon la coutume. Ce test n'a évidement aucune chance de produire un résultat significatif : pourquoi le serait-il d'un côté plutôt que de l'autre ?

 

Si le lecteur accepte cela comme démonstration convaincante du fait que les ajustements ne peuvent en aucun cas se substituer à une dissociation adéquate des données, il peut penser que les auteurs d'études veillent soigneusement à les réaliser quand ils s'imposent.

Que nenni comme diraient les servantes de Molière, on est très loin du compte ! C'est ce que je vais faire constater ci-après.

Si l'expérience aléatoire consiste à lancer des pièces de monnaies, la première question à se poser est "les pièces ont-elles toutes, à chaque jet, la même probabilité de tomber sur pile ?" Le lanceur pourrait se contenter, parfois, de lancer la pièce à plat sans la faire tournoyer en l'air.

Ces questions sont fondamentales. Il devrait en aller de même pour une étude cas-témoins où on veut étudier la relation entre une exposition à un vaccin par exemple et l'apparition d'une maladie comme une sclérose en plaques par exemple. Qu'en est-il ?

EXEMPLE 2

Les 2 publications Mikaeloff-Tardieu de décembre 2007 et du 8 octobre 2008 sur le lien entre la vaccination hépatite B et la sclérose en plaques (SEP) ou les atteintes démyélinisantes centrales (ADC) incluant les SEP. Rappelons que les enfants étaient indemnes d'atteintes démyélinisantes centrales au moment de la vaccination.

J'ai déjà publié sur ce blog 2 longs articles sur ces études [6] et [7] où le lecteur trouvera les liens vers ces études et de nombreuses indications.

Dans la publication 2007, les auteurs avaient retenu 143 cas de SEP dont 80 étaient vaccinés. Ils furent associés à 1122 témoins dont 609 vaccinés. En cherchant bien dans la publication j'ai pu trouver 4 nombres dispersés en 3 endroits différents : ils donnent les nombres de cas et de témoins ainsi que les nombres de vaccinés chez les enfants pour lesquels la première ADC n'était pas apparue avant l'âge de 10 ans. Il y en a 101 dont 70 vaccinés ainsi que 765 témoins dont 512 vaccinés. On obtient aussitôt les valeurs correspondantes pour les enfants de moins de 10 ans, soit 42 cas dont 10 vaccinés, 357 témoins dont 97 vaccinés. Voici les pourcentages de vaccinés parmi les cas et les témoins :

 

Pourcentages vaccinés

< 10 ans

> 10 ans

Total

CAS

23,81%

69,31%

55,94%

TEMOINS

27,17%

66,93%

54,28%

Témoins / Cas

8,50

7,57

7,85



CONSTATS

Quatre remarques importantes s'imposent :

1- Le principe du test est de comparer les proportions de vaccinés parmi les cas et les témoins. Nous constatons que les écarts sont énormes entre les moins de 10 ans et les plus de 10 ans : moins de 24% contre plus de 69% chez les cas entre les moins de 10 ans et les autres ; 27% chez les témoins de moins de 10 ans contre près de 67% chez les plus de 10 ans.

2- De plus, le taux de vaccinés chez les témoins de moins de 10 ans est supérieur aux taux chez les cas correspondants alors que c'est l'inverse pour les plus de 10 ans. Les 2 groupes allant en sens inverse, les cumuler ne pourra que contribuer à neutraliser tout signal éventuel.

3- De plus encore, la moyenne des témoins par cas est 8,5 chez les moins de 10 ans contre 7,57 chez les autres. J'ai montré dans [3] que pour cumuler 2 groupes il était très important que les moyennes des témoins par cas soient égales. Dans le cas contraire, le cumul accordera un poids plus important au groupe ayant la moyenne de témoins par cas la plus élevée. Ici c'est le groupe des moins de 10 ans dont la tendance est côté vaccin "protecteur". Le cumul favorisera donc cette tendance.

4- La durée d'observation n'est pas du tout la même selon les classes d'âge des enfants. J'étudierai ce problème plus loin.

Ce constat, facile et immédiat, imposait de créer au moins 2 groupes : les moins de 10 ans et les autres. Les auteurs ne l'ont pas fait !

Il FAUT comprendre que vouloir comparer les 55,94% de vaccinés

parmi les 143 cas aux 54,28% de vaccinés parmi les 1122 témoins est une question

pratiquement dépourvue de tout intérêt dans ces conditions !



C'est d'abord mon histoire de choux bio et pas bio racontée dans Comparaison de deux proportions, un fort risque d'occulter un signal ! [1]. Le problème est aggravé ici par les remarques 2, 3 et 4 ci-dessus.

Et ce n'est pas tout !

En effet, le groupe des plus de 10 ans n'est certainement pas homogène non plus : il contient les enfants vaccinés au collège en sixième entre octobre 1994 et juin 1998 soit 4 classes d'âge auxquels s'ajoutent les enfants vaccinés plus âgés*. Pour les premier, le taux de vaccination pourrait être de l'ordre de 80% et de l'ordre de 45-50% pour les plus âgés**. C'est donc au moins 3 groupes qu'il aurait fallu constituer : les classes d'âge vaccinées en sixième flanquées des plus jeunes et des plus âgés.

* Il pourrait inclure aussi des enfants vaccinés à l'âge de 7 ans, par exemple, puis ayant fait leur première ADC à 12 ans car c'est l'âge de la première ADC qui a été retenu et non celui de la vaccination. Pour leurs témoins associés, c'est cette date qui a été utilisée pour définir leur statut vaccinal. Les vaccinés sont donc ceux qui avaient reçu au moins une dose au moment de la première ADC du cas associé. Un tel cas pourrait donc avoir beaucoup de témoins vaccinés alors qu'au moment de sa propre vaccination ils étaient sans doute très peu nombreux (en gros, 80% contre 25%). Si de tels cas existent, cela constituerait une anomalie flagrante qui ne peut que favoriser un ods ratio faible en augmentant le nombre de témoins vaccinés.

** Une étude [5] sur la couverture vaccinale contre l'hépatite B réalisée par François Denis parle, page 120, des taux de vaccination "signalés après les campagnes de vaccination en milieu scolaire en 1994-95 de l'ordre de 75-82%".

De plus, il existe plusieurs indications en faveur du fait que le groupe des plus âgés pourrait, comme les plus jeunes, être orienté côté vaccin "protecteur'' en raison d'un défaut de notification. Ce défaut pouvant s'expliquer par l'arrêt de la prise en compte des cas après 16 ans (ou au 31 décembre 2003). Aussi, un adolescent vacciné tardivement disposait de moins de temps que d'autres enfants pour que sa première ADC apparaisse dans les limites définies par l'étude, la date retenue étant celle de la première atteinte.



Il serait donc essentiel de disposer des données concernant

le groupe des classes d'âge vaccinées en sixième



Un test très significatif

Grâce à la publication du 8 octobre 2008 on peut disposer de données sur l'ensemble des ADC regroupant les ADC simples et multiples (SEP) : 154 vaccinés parmi 349 cas associés à 2941 témoins dont 1398 vaccinés. Par soustractions avec les données pour la SEP on obtient les données pour les ADC simples : 349-143=206 ADC simples dont 154-80 =74 vaccinés ; 2941-1122 =1819 témoins associés dont 1398- 609=789 vaccinés.

Voici les résultats de différents tests qu'on peut pratiquer sur ces données (tableau ci-dessous). J'ai exposé dans l'article précédent [3] (voir aussi [1] et [2]) trois tests que j'ai nommé V, W et Z. Tous sont des tests binomiaux mais ce qui les distingue est une estimation différente de la variance. Pour la SEP j'ai appliqué le test Z à la partition "moins de 10 ans'' et "au moins 10 ans''. Pour le test global par Z j'ai ajouté les ADC simples. Pour la SEP on peut observer que le test Z est très proche du test par l'odds ratio ajusté proposé par les auteurs de l'étude. Notons cependant :

Aucun de ces tests n'a pu être appliqué dans des conditions pleinement satisfaisantes



Lorsque l'odds ratio OR est inférieur à 1, deux probabilités sont données, celle qui correspond à "au moins aussi grand que la valeur observée"'et son complémentaire à 1 qui correspond à "au plus aussi grand que la valeur observée" :

Comme les bornes de l'intervalle de confiance IC ont été calculées à partir de l'OR et de la variance, on peut retrouver la variance à partir de l'IC et de l'OR, ce qui m'a permis de calculer la probabilité d'obtenir au moins 0,81 qui vaut 93,88%. 



Dans la publication de 2008 les auteurs en sont resté là sur ce point. Fort heureusement la publication de décembre 2007 va permettre d'aller plus loin. On peut comparer les probabilités qui ont été calculées de la même façon. Pour ADC+SEP elle vaut 88,6% qui est une sorte de "moyenne" entre 35,32% pour les SEP et 98% pour le groupe complémentaire des ADC simples.

 

 

ADC simples

SEP

ADC simples + SEP

OR ajusté

Non publié

1,10 ; 33,48%

0,81 ; 93,88% ; 6,12%

OR direct

0,73 ; 98,00% ; 2,00%

1,07 ; 35,32%

0,87 ; 88,60% ; 11,4%

Test V

97,98% ; 2,02%

35,32%

88,6% ; 11,4%

Test W

97,11% ; 2,89%

35,32%

88,69% ; 11,31%

Test Z

Non applicable*

33,90%

89,91% ; 10,09%



* Non applicable faute de données permettant de réaliser une partition pourtant sûrement nécessaire.

Pour les ADC simples on peut constater que 2 tests donnent un résultat significatif côté "vaccin protecteur" : le test avec OR=0,73 calculé directement (sans ajustement) et le test V qui donnent 2,00% et 2,02%.

Ce résultat significatif exprime un déficit d'ADC simples chez les vaccinés. Où sont-ils passé ? Soit vers la case "rien" (effet protecteur), soit vers la case "SEP" (effet aggravant).

 

En fait on obtient ce résultat beaucoup plus simplement, sans faire appel aux témoins et avec un test beaucoup plus significatif :

EXEMPLE 3

Chez les enfants vaccinés il y a donc eu 154 ADC dont 80 se sont transformées en sclérose en plaques (SEP) contre 63 SEP parmi 195 ADC chez les non vaccinés. Les probabilités d'évolution d'une ADC simple en SEP peuvent ainsi être estimées par 80/154=51,95% chez les vaccinés et par 63/195=32,31% chez les non vaccinés. A vue, l'écart parait très important alors que les nombres absolus sont assez élevés, ce qui est favorable à un résultat significatif. Voilà une observation facile à faire et qui aurait pu au moins alerter (elle le peut toujours !)

On peut préciser par les tests de comparaison de 2 lois binomiales :

Test W : 9,2/100000 Test V : 11/100000 Tous les 2 sont proches de 1/10000

C'est donc très, très significatif, ce qui permet de formuler l'hypothèse :

 

Hypothèse

La vaccination hépatite B aurait fait évoluer en sclérose en plaques un certain nombre de cas qui sans cela n'auraient été que des ADC simples, (non SEP) dans la fenêtre d'observation.

Rappelons que les enfants ne souffraient d'aucune ADC au moment de leur vaccination.

 

Si on se contentait de traiter le groupe complet comme l'ont fait les auteurs, on passerait à côté d'une hypothèse très intéressante : l'effet "protecteur" de la vaccination contre les ADC simples pouvant être en réalité un effet aggravant les ayant fait évoluer vers une SEP.

 

 Notons que ce test ne fait pas appel aux témoins mais seulement aux cas observés, ce qui est beaucoup plus fiable. On peut cependant formuler une réserve : les lois sont supposées binomiales alors qu'elles ne le sont pas en réalité. Il faudrait pouvoir disposer d'autres données pour réaliser les partitions nécessaires. On ne peut cependant exclure qu'en se restreignant aux classes d'âge vaccinées en sixième le résultat soit encore plus significatif malgré la réduction des effectifs qui pourrait être largement compensée par l'élimination des plus jeunes et des plus âgés pour lesquels la tendance est opposée (avec les conditions de l'étude).

 

Hypothèse contredite par les moins de 10 ans ?

Cette hypothèse et le test sur lequel elle s'appuie pourraient paraître en opposition avec le fait que le taux de vaccinés chez les témoins est plus élevé (27,17% ) que parmi les cas (23,81%). Cette contradiction apparente a une explication : les enfants jeunes ont été nombreux à faire leur première ADC AVANT d'avoir pu être vaccinés. S'ils avaient été vaccinés plus tôt ils auraient fait leur ADC tout pareil. Mais ils auraient été classés "vaccinés" et ça changerait tout.

Chacun de se dire : "Mais ils auraient été des coïncidences, donc ainsi on a éliminé des coïncidences parmi les vaccinés,  c'est plutôt une bonne chose !"

Cela pourrait paraître pertinent, cependant le problème est que le signal apparaît par l'addition des coïncidences et des non coïncidences ! Si on supprime les premières, on a toute chance de tuer le signal puisque la comparaison se fait, d'une façon ou d'une autre, avec ce qui se serait produit en l'absence de vaccination.

Dans une étude cas-témoins, cette comparaison ce fait par le truchement de la proportion de vaccinés parmi les témoins, comparée à celle des cas. C'est une étude rétrospective où les enfants ne sont pas tous vaccinés au même âge ni dans les mêmes conditions. C'est le péché originel des études rétrospectives par rapport à des expérimentations animales classiques où les souris sont toutes vaccinées le même jour pour être suivies parallèlement à d'autres souris du même âge et de santé comparable au début de l'observation, c'est à dire le jour de la vaccination.

Comme il n'est pas raisonnable d'attribuer un effet protecteur réel au vaccin et qu'on peut au contraire tout à fait envisager un effet aggravant de la vaccination en faveur de la SEP, le fait que le taux de vaccinés parmi les cas n'atteigne pas 24% contre plus de 27% chez les témoins pourrait être perçu comme indicateur d'un réel déficit de notification de SEP chez les vaccinés, déficit pouvant être attribué, pour une part, à ce péché originel.

Il y a aussi une autre possibilité : un enfant vacciné à l'âge de 8 ans a pu faire sa première ADC à 10 ans ou plus. Il n'aura alors pas été classé parmi les "<10ans". D'où un déficit possible de cas chez les vaccinés de ce groupe. On a alors le même problème qu'avec la limite au delà de 16 ans qui génère sans doute un déficit de cas parmi les plus âgés comme on va le voir maintenant.

 

Un déficit de SEP chez les plus âgés ?

Chez les plus âgés, le déficit probable de SEP serait dû au fait que les adolescents vaccinés à 14-15 ans avaient peu de temps devant eux pour faire une ADC avant la limite fixée à 16 ans. Il existe plusieurs indications allant en ce sens. En voici une :

 Le fameux résultat significatif publié le 8 octobre 2008 mais qui avait défrayé la chronique dès le 26 septembre, concernait le groupe des enfants vaccinés Engerix, dont la première ADC était apparue au moins 3 ans après la vaccination et qui avaient reçus avant l'âge de 2 ans 4 DTP, 1 BCG et 1 ROR (observants au calendrier). L'OR ajusté par régression logistique conditionnelle valait 2,77. Par l'intervalle de confiance j'ai pu récupérer la variance utilisée et calculer la probabilité associée qui vaut 0,7% proche du très significatif (<0,5%).

 Trois considérations :

 1-La condition "au delà de 3 ans après la vaccination" écarte tous ceux qui avaient été vaccinés moins de 3 ans avant l'âge butoir de 16 ans. Ce seul critère écarte donc la plupart des adolescents du groupe des "plus âgés". Si ce groupe a un OR inférieur à 1, voire largement inférieur à 1, voire significatif côté "vaccin protecteur", le seul fait de les retirer fera croître l'OR du groupe restant.

 

2- La condition "vaccinés Engerix" retient tout particulièrement les enfants vaccinés en sixième par le fait que le ministre avait accordé en 1994 le marché des collèges au laboratoire SKB devenu GSK, le producteur d'Engerix.

 

3- À ces enfants s'ajoutent, certains enfants pris dans le groupe "< 10 ans". Or ce groupe a un OR inférieur à 1, ce qui ne favorise pas, a priori, l'obtention d'un OR élevé .

 

Ces 3 considérations conduisent à penser que le groupe significatif retenu par ces critères a une très forte ossature "vaccinés en sixième" qui devrait donc avoir un OR assez grand, même s'il n'est pas significatif. Cela paraît indispensable pour permettre au groupe "Engerix--Observant-calendrier--Plus-de-3ans" d'être largement significatif.

De plus, quand on adjoint aux "vaccinés en sixième" le groupe des " plus âgés" on constate que l'OR devient faible même s'il est légèrement supérieur à 1 (OR=1,12 avec la probabilité 31,62% ; voir plus loin). Pour obtenir cela il paraît pratiquement vraisemblable que l'OR du groupe "plus âgés" soit inférieur à 1. D'où l'indication d'un déficit de cas chez les plus âgés.

On peut aussi observer que parmi les 80 cas de SEP chez les vaccinés, 50 avaient reçu Engerix. Pour  25 d'entre-eux la première ADC était apparue dans un délai ne dépassant pas 3 ans (50%) contre 15 pour Genhevac (68,18%). La répartition parait donc déséquilibrée pour Genhevac par rapport à Engerix. Cela pourrait être dû au fait que des adolescents vaccinés avec Genhevac et ayant fait leur ADC plus de 3 ans après, avaient dépassé l'âge de 16 ans. Bien sûr, le même phénomène a certainement joué aussi pour Engerix. Mais la vaccination quasi exclusive par Engerix des enfants en classe de sixième a pu permettre d'alimenter la catégorie ">3ans" pour Engerix, ce qui n'était pas possible avec Genhevac. 

 

 

Ajuster ou dissocier ?

QUESTION : puisque sur l'exemple c'est l'âge qui contraint à dissocier pour pratiquer les tests binomiaux, peut-on envisager qu'un ajustement sur l'âge puisse compenser les écarts et éviter la dissociation susceptible de faire perdre de la puissance statistique ?

Je vais tenter de répondre à cette interrogation en poursuivant avec le même exemple.

On sait que les 4 classes d'âge vaccinées en classe de sixième au collège entre octobre 1994 et juin 1998 l'ont été pratiquement à 80% alors que les plus âgées l'ont été beaucoup moins. Aussi, les taux de vaccinés 69,31% et 66,93% chez les 101 cas et les 765 témoins ne correspondent pas davantage à une loi binomiale. Il faudrait aussi dissocier ces 101 cas pour créer 2 groupes plus homogènes du point de vue du taux de vaccination avec le groupe des "sixième" et celui des "plus âgés".

Voici une simulation purement pédagogique où seuls les nombres en noir sont réels (valeurs publiées). Lorsque l'OR est inférieur à 1, deux probabilités sont données, celle qui correspond à "au moins aussi grand que la valeur observée"'et son complémentaire à 1 qui correspond à "au plus aussi grand que la valeur observée" :

 

 

"< 10 ans"

"sixième"

"Plus âgés"

" > 10 ans"

totaux

Cas

42

68

33

101

143

vaccinés

10

61

9

70

80

Témoins

357

476

289

765

1122

vaccinés

97

375

137

512

609

OR direct

Probabilités

0,84 

67,89% ;32,11%

2,347

1,98%

0,416

98,41% ;1,59%

1,12

31,62%

1,07

35,32%

Test V

67,91% ;32,09%

1,73%

98,61; 1,39%

31,61%

35,32%

Test W

68,53% ; 31,47%

0,43%

99,17% ; 0,83%

31,42%

35,32%

 

Cette simulation, qui n'est pas incompatible avec les données publiées, montre clairement qu'on pourrait avoir un groupe significatif côté "vaccin dangereux" chez les vaccinés en classe de sixième, un groupe significatif côté "vaccin protecteur" chez les adolescents "plus âgés" et qu'en cumulant ces 2 groupes, les 2 signaux significatifs se neutralisent chez les " >10 ans".

L'objectif ici est seulement pédagogique. Il s'agit de faire réaliser qu'en pareil situation, un ajustement sur les données globales, aussi sophistiqué soit-il, sera incapable de mettre en évidence une telle situation.

 

Pour les tests appliqués aux données publiées, on peut constater que ceux réalisés en dissociant les moins de 10 ans des plus de 10 ans et sans ajustement donnent des résultats qui peuvent s'éloigner beaucoup des valeurs obtenues globalement par les auteurs avec ajustement logistique conditionnel sur l'âge, la région et le sexe mais sans dissocier : 68,53% et 31,42% contre 33,48%.

Remarque :

Il faut bien sûr comparer des probabilités obtenues dans les mêmes conditions, soit ici la probabilité d'obtenir une valeur au moins aussi grande que celle observée, d'où le 68,53%.

 

Cela suggère qu'une dissociation, qui s'impose quand les taux de vaccination sont très différents comme ici, pourrait avoir plus d'importance qu'un ajustement sans dissociation. Autrement dit, cela montre assez bien qu'un ajustement sur l'âge (ou autres critères) ne devrait pas pouvoir compenser des écarts trop importants entre les taux de vaccination (plus généralement d'exposition).

 

La grande crainte en dissociant est sans doute de perdre de la puissance statistique. Mais cela n'a d'intérêt que si les différents groupes vont dans le même sens. Si une pièce de 1€ est déséquilibrée du côté des piles et celle de 2€ du côté des faces il n'y a aucun intérêt à cumuler les résultats.

 

 

Conclusion

L'ajustement ne saurait se substituer à la dissociation

 

 Je n'ai initialement aucune expérience pour traiter des données de cette nature. Si j'étais confronté à ces données, je procéderai ainsi :

Je chercherai si je peux accepter que chaque cas ait eu la même probabilité d'avoir été vacciné. De même pour chaque témoin. Comment ? D'abord en comparant les nombres de vaccinés parmi les témoins associés on doit pouvoir obtenir facilement une première indication.

Par exemple, Pierre a 10 témoins dont 2 sont vaccinés alors que Jacques en a 8 sur 10 et Paul 5 sur 10. Un regard sur l'âge de la vaccination indique que Pierre avait 5 ans au moment de celle-ci alors que Jacques était en sixième en 1996 et que Paul avait 14 ans.

De plus, compte tenu de ce que l'on sait du déroulement de la campagne de vaccination et des études réalisées sur la couverture vaccinale, on pouvait être mis en alerte quant à la nécessité de créer plusieurs groupes afin de respecter au mieux le caractère binomiale des variables donnant les nombres de cas et de témoins vaccinés.

La nécessité de créer 3 groupes devrait ainsi apparaître très facilement et très rapidement.

Au lieu de procéder ainsi, les auteurs paraissent s'empresser de globaliser les données en aveugle pour lancer ensuite un logiciel réalisant une analyse multivariée selon plusieurs paramètres comme l'âge au moment de la première ADC (et non pas l'âge de la vaccination, ce qui pose aussi un problème), la région du cas et son sexe.

On voit le résultat !!!

 

Les auteurs passent en particulier à côté d'un signal très fort

qui pourtant ne demande même pas de faire appel aux témoins

et qui apparaît en formant seulement 2 proportions !!!

 

 

Durée d'observation variable

 


Obtenant un résultat significatif avec Engerix et pas avec Genhevac, les auteurs et les Comités d'experts s'interrogent longuement sur les mérites comparés de la culture sur levure (Engerix) et de la culture sur ovaire de hamster chinois (Genhevac). Ils oublient de se demander si cela ne serait pas dû à tout autre chose, à savoir : le fait que le ministre de la santé avait accordé en 1994 le marché des collèges au fabricant d'Engerix, que l'essentiel des vaccinations chez les enfants avait été réalisé au collège en classe de sixième et que ces derniers avaient tous été suivis pendant la même durée d'au moins 4 ans jusqu'à 16 ans.

Sans voir que, pour les enfants plus jeunes, beaucoup moins vaccinés, la tendance "vaccin protecteur" (même légère) est sans doute dû au fait que beaucoup ont fait leur première ADC avant d'avoir pu être vaccinés. Que la même tendance chez les plus âgés (vraisemblable mais que les auteurs pouvaient aisément constater si elle est réelle) est sans doute liée au fait que ceux-ci disposaient de trop peu de temps pour qu'une ADC se manifeste avant la limite des 16 ans.

  Plus précisément, l'observation était limitée à l'âge de 16 ans et à 2003 pour la première ADC. Ceux qui en avaient fait une dans ces limites étaient alors suivis jusqu'au 30 juin 2006 pour voir si elle évoluait en SEP.

 Aussi, ceux qui ont été vaccinés 3 mois avant la limite de 16 ans ne disposaient que de cette durée pour faire leur première ADC.

 Extraits de la revue Mal Respir sur la régression logistique [9], page 159 :

 « La méthode de régression logistique est donc la méthode multivariable de choix pour rechercher des facteurs de risque ou de des facteurs protecteurs de maladie. Toutefois, il ne faut pas oublier qu’elle reste une simplification mathématique de phénomènes complexes,

 

qu’elle repose théoriquement sur des conditions,

dont le respect est trop peu souvent vérifié par les chercheurs qui l’appliquent.

  La régression logistique est différente du modèle de Cox car elle ne permet pas la prise en compte de données censurées (c’est-à-dire en tenant compte des temps d’observation individuels).

Elle impose des données pour lesquelles les patients

ont été observés pendant la même période. »


C'est la seule condition que j'ai trouvée mentionnée... Il y en a bien sûr d'autres très importantes.

 

 Un intervalle de confiance inutile

 Dans la publication Mikaeloff-Tardieu 2007 sur la SEP, pour les données globales, les auteurs donnent un odds ratio OR= 1,10 et un intervalle de confiance [0,71 1,69]. J'ai donné auparavant la probabilité associée à ce test : 33,48%*. Elle donne évidemment une information beaucoup plus précise que l'IC sur le degré d'éloignement de la valeur observée 1,10 par rapport à la valeur théorique 1.

 

* Il faut cependant noter que la plage de variation de la probabilité associée au test se situe entre 0 et 50%. Au delà de 50%, cela signifie que l'odds ratio est inférieur à 1. On prend alors son complémentaire à 1.

 

Quand on connait la valeur théorique d'un paramètre, non seulement l'intervalle de confiance associé à ce paramètre est inutile mais il donne une information moins précise que la probabilité associée au test d'hypothèse.

 

Malgré cela, les auteurs préfèrent l'intervalle de confiance pourtant inutile en pareil cas et ne calculent pas la probabilité associée au test d'hypothèse. On ne peut que le regretter.

 Pourquoi  cela ? Les "raisons" ont été exposées le 11 septembre 2003 par Dominique Costagliola, considérée comme une de nos meilleures épidémiologistes, lors de la réunion dite de consensus sur la vaccination hépatite B (le lien vers son exposé a été cassé en 2011  mais on peut vérifier sur ce lien [10] qu'elle avait été auditionnée comme expert).

 

« Le résultat d'une étude d'association s'exprime par un risque relatif ou un odds ratio assorti d'un intervalle de confiance. Ces éléments sont plus importants à considérer que la simple interprétation du test d'association en significatif/non significatif … un risque de 3 avec un intervalle (de confiance) [1,1 ; 600] nous dit que l'étude manque grossièrement de puissance puisque le risque peut être à peu près n'importe quoi »

 

Mais peut-on avoir un intervalle de confiance entre 1,1 et 600  avec un odds ratio de 3  ?  On peut aisément démontrer qu'un tel écart est très largement impossible : on sait en effet que le carré de l'odds ratio est le produit des bornes de l'intervalle de confiance.

 

On peut vérifier cette règle sur l'exemple cité pour lequel OR=1,10 avec IC=[0,71 1,69]. On a en effet 1,1²=1,21 et 0,71x1,69=1,1999.

 Un autre exemple avec le fameux résultat significatif de l'étude publiée en 2008 sur le même thème et qui avait fait beaucoup de bruit : on a OR=2,77 et IC=[1,23 6,24]. On vérifie que 2,77²=7,6729 et que 1,23x6,24=7,6752.

 

Avec les valeurs à but "pédagogique" inventées par l'auteure de ce propos, il faudrait donc que 3²=9 soit égal à 600x1,1=660 !!!  En fait, avec OR=3 et la borne inférieure égale à 1,1 la borne supérieure vaudra 8,18... 

 Un peu navrant quand même !

 

Analogie avec la règle de trois

 La fameuse règle de trois, "3 choux coutent 10€ combien coutent 10 choux ?" qui a jalonné notre parcours à l'école primaire, les plus jeunes l'ayant appliquée sous la forme d'un tableau de proportionnalité, n'est pas aussi éloignée des problèmes soulevés ici qu'on pourrait le croire.

 En effet, la règle de trois consiste à comparer 2 proportions où il est indispensable que tous les choux soient au même prix :

Pour la règle de trois on forme 10/3=p qui donne le prix moyen des 3 choux considérés. Si on désigne pas X le prix des 10 choux, X/10=p' sera le prix moyen des 10 choux. En écrivant p=p' on pourra calculer X. Si le prix des choux n'était pas le même pour tous, il n'y aurait aucune raison pour que p=p' qui ici ne peut être une hypothèse. Il est donc indispensable que p soit le prix de chacun des choux considérés. L'égalité p=p' est une conséquence de l'hypothèse fondamentale mais malheureusement trop souvent laissée implicite dans l'enseignement, que les choux sont tous au même prix.

 

Quand on a deux proportions observées 40/50 et 360/500 pour 50 cas et leurs 500 témoins, la différence 0,08 de ces 2 proportions est la valeur observée de la variable aléatoire U= X/50-X'/500 supposée suivre une loi normale caractérisée par 2 nombres, son espérance (la valeur attendue) et sa variance. On teste l'hypothèse que l'espérance E(U) de U est nulle. Cette hypothèse s'écrit E(X)/50=E(X')/500 qui correspond à l'égalité des 2 proportions avec la règle de trois mais qui ici est une hypothèse que l'on veut tester.

Si X est une variable aléatoire binomiale B(50 ; p) et X' binomiale B(500 ; p'), l'hypothèse E(U)=0 s'écrit. Mais X binomiale signifie que chacun des 50 cas avait la même probabilité p d'avoir été vacciné. De même, chacun des 500 témoins avait la même probabilité p' d'avoir été vacciné. On retrouve la condition pour les choux de la règle de trois.

 

Même s'il est possible de sortir de cette situation très stricte, on a vu qu'il fallait être très prudent dès que X et X' n'étaient plus binomiales, ce qui ne semble pas être la caractéristique dominante des auteurs d'études cas-témoins ni des comités d'experts qui les commentent parfois. Ils ne sont pas les seuls responsables, les enseignements sur ces questions sont très laxistes sur les conditions d'applications des tests avec l'odds ratio même si, parfois, ils signalent qu'il en existe mais sans pour autant les expliciter pour montrer ce qui peut arriver quand on ne les respecte pas.

 

[1] Comparaison de deux proportions : un fort risque d'occulter un signal !

http://questionvaccins.canalblog.com/archives/2014/02/06/29133753.html


[2] Comparaison de 2 proportions : un test doublement biaisé !

http://questionvaccins.canalblog.com/archives/2014/02/09/29163341.html

 

[3] Comparaison de 2 proportions par l'odds ratio

L'odds ratio est-il meilleur que les tests binomiaux ?

http://questionvaccins.canalblog.com/archives/2014/02/18/29247121.html

[4]Glossaire 

http://www-sante.ujf-grenoble.fr/SANTE/cms/sites/medatice/externat/externatgre/docs/20121112164003/Glossaire_LCA.pdf

[4bis] épidémiologie pour les nuls

https://www.chu-brest.fr/documents/10156/108763/Epidemiologie+pour+les+nuls.pdf

[5] François Denis : étude sur la couverture vaccinale

http://www.academie-medecine.fr/wp-content/uploads/2013/03/2004.1.pdf#page=113

[6] 18 mars 2011

Sclérose en plaques chez les enfants : des données très démonstratives...

[7] 10 avril 2011

Vaccin hépatite B et sclérose en plaques chez les enfants : une étude aussi contestable que révélatrice

[8] Cours sur la régression logistique (peu accessible)

http://eric.univ-lyon2.fr/~ricco/cours/cours/pratique_regression_logistique.pdf

[9] http://www.ifmt.auf.org/IMG/pdf/Qu_est-ce_qu_une_regression_logistisque_-_Rev_Mal_Respir_2005_22_159-162.pdf

[10] http://www.has-sante.fr/portail/upload/docs/application/pdf/VHB_recos.pdf

Posté par BernardGue à 22:12 - Commentaires [0] - Permalien [#]

18 février 2014

Comparaison de 2 proportions par l'odds ratio

L'odds ratio est-il meilleur que les tests binomiaux ?

Le test par l'odds ratio est un test de comparaison de 2 proportions utilisé dans le cadre des études dites cas-témoins. Il prend une forme multiplicative qui introduit un nouveaux biais sans supprimer des biais déjà décrits dans l'article précédent [1]. Son principal avantage, sans doute à l'origine du succès de cette forme, est que l'odds ratio peut s'assimiler au risque relatif, du moins quand le risque est faible. Mais à quel prix ?



Le test de l'odds ratio dans les études cas-témoins

Je vais d'abord décrire sur un exemple le principe du test utilisant l'odds ratio pour comparer 2 proportions.

EXEMPLE 1

Parmi 50 malades, 40 avaient été vaccinés avant l'apparition de la maladie. Il a été associé à chacun d'eux 10 témoins non malades (même âge, même sexe, même région ...), soit 500 en tout, dont 360 étaient vaccinés. Peut-on penser que la vaccination aurait pu favoriser la maladie ?

Principe

On va admettre que chaque malade avait la même probabilité p d'avoir été vacciné et de même pour chaque témoin avec la probabilité p'. Aussi, les variables aléatoires X et X' donnant les nombres de vaccinés parmi les 50 cas et les 500 témoins vont suivre les lois binomiales B(50 ; p) et B(500 ; p') dont les moyennes théoriques seront 50p et 500p', les variances étant 50p(1-p) et 500p'(1-p').

L'objectif du test sera de comparer les proportions théoriques inconnues p et p' en utilisant les valeurs observées 40/50 et 360/500. Si p est significativement supérieur à p' on aura un signal pouvant faire penser que la vaccination aurait pu favoriser l'apparition de la maladie.

Voici d'abord les résultats des 2 tests déjà présentés dans l'article précédent avec les notations de celui-ci [1]:

 

Test par W : En utilisant une estimation sans biais de la variance la probabilité associée au test* vaut 9,33% ( estimateur W de [1]).

Rappel : ici, W prend la valeur (40/50)(1-40/50)/49 + (360/500)(1-360/500)/499

* Il s'agit de la probabilité d'obtenir un écart au moins aussi grand que celui qui a été observé.

 

Test par V : En utilisant une estimation doublement biaisée on trouve 11,29% (estimateur V de [1])

Rappel : ici V prend la valeur (40+360)/[1- (40+360)/(50+500)][1/50 + 1/500]

 

Test par OR : On va leur ajouter le test par l'odds ratio OR :

Le test par l'odds ratio sera fondamentalement très proche des précédents mais en prenant une forme multiplicative obtenue en transformant les sommes en produits et les différences en divisions comme le ferait une fonction exponentielle.

Pour les cas on forme l'odd 40/10 qui est le rapport entre les 40 cas vaccinés et les 10 non vaccinés. De même pour les témoins avec l'odd 360/140. On forme alors l'odds ratio, noté OR, qui sera le quotient de ces 2 odds, soit ici OR=1,56.

Sous l'hypothèse que les cas et les témoins aient la même probabilité théorique d'avoir été vaccinés ("hypothèse nulle "), la valeur moyenne théorique de cet odds ratio vaudra 1 (le rapport théorique entre vaccinés et non vaccinés sera le même pour les cas et les témoins). En pratique, ce rapport pourra s'éloigner de 1, l'objectif du test étant de chercher à savoir si la différence observée avec 1 peut être attribuée à de simples variations aléatoires ou à une cause particulière.

On admet que le logarithme de OR suit une loi normale centrée (moyenne zéro) dont on sait estimer la variance à partir des résultats observés (voir mon article [2]). Il devient alors possible de calculer la probabilité d'obtenir un écart avec 1 qui soit au moins aussi grand que celui observé, c'est à dire d'obtenir au moins 1,56.

 

Valeur de OR : avec OR=1,56 la probabilité associée au test sera 11,45% .

Constat : On a vu que le test avec W était plus fiable que le test avec V. Sur cet exemple le test par l'odds ratio donne donc une valeur un peu moins bonne qu'avec le test V, ce qui permet de dire, au moins sur cet exemple, qu'il est le moins bon des 3 tests.

On pourrait donc penser que le test par l'odds ratio aurait au moins les mêmes défauts que le test par l'estimateur doublement biaisé noté V, voire un autre en plus.

On peut au moins dire que la variance utilisée pour l'odds ratio combine les cas et les témoins sous la forme 1/a+1/b+1/a'+1/b' a et a' sont les cas et les témoins vaccinés, b et b' les cas et les témoins non vaccinés.  Elle sera d'autant plus faible que les témoins associés au cas seront plus nombreux.

Les moyennes théoriques des valeurs observées a et b sont np et n(1-p) aussi, en écrivant :

1/np+1/n(1-p)=[(1-p)+p]/np(1-p)=1/np(1-p)

 on met en évidence que la variance liée à l'odds ratio (en fait à son logarithme) sera en relation avec* :

 1/np(1-p) +1/n'p'(1-p')

Au lieu de tester la différence a/(a+b)-a'/(a'+b') comme dans les tests binomiaux, on teste en réalité la différence des logarithmes ln(a/b)-ln(a'/b') dont la valeur théorique attendue est 0 (l'espérance). On mesure l'écart en modélisant par une loi normale de moyenne 0 et en estimant la variance à partir des valeurs observées.

* J'ai écrit "en relation avec..." car l'espérance de 1/a n'est pas l'inverse de l'espérance de a.

 

Il peut être intéressant d'étudier les variations de la probabilité liée au test en fonction du nombre de témoins tout en conservant la même proportion de vaccinés.

Avec 5 témoins par cas, soit 250 témoins dont 180 vaccinés  puis avec 100 témoins par cas, soit 5000 témoins dont 3600 vaccinés :

Témoins par cas

Test par W

Test par V

Test par OR

5

10,51%

12,15%

12,28%

10

9,33%

11,29%

11,45%

100

8,20%

10,48%

10,66%



CONSTATS : les probabilités associées aux tests diminuent sensiblement quand le nombre de témoins augmente*. Le test par V est nettement moins bon que le test par W et le test par OR reste proche du test par V tout en étant un peu moins bon.

* Cependant, cette règle est mise en défaut dans certains cas comme on le verra plus loin. C'est surtout une amélioration de la fiabilité qui pourrait aussi, a priori, se traduire par un accroissement de la probabilité selon la réalité des données.

Reprenons les valeurs des exemples 1 et 5 de l'article précédent [1] :

 

 

Test par W

Test par V

Test par OR

n=100  x=85  n'=1000, x'=770

1,83%

3,34%

OR=1,69 ;  3,48%

n=100  x=95  n'=1000, x'=880

 0,19%

1,77%

OR=2,59  ;  2,12%



CONSTATS : Le test par W servant de référence, on constate là aussi que le test par OR est un peu moins bon que le test par V. Pour le premier exemple, le test par W est significatif au seuil 5% bilatéral (<2,5%) alors que les tests par V et par OR ne le sont pas. Pour le second exemple, le test par W est très significatif au seuil bilatéral de 1% (<0,5%) mais pas les tests par V et OR qui le sont seulement au seuil  5%.



Addition de 2 binomiales (ou plus)

X1 et X2 seront 2 variables aléatoires binomiales B(ni ; pi), X'1 et X'2 les variables aléatoires B(n'i ; p'i) correspondant aux témoins associés. On considère les variables aléatoires Y=X1+X2 et Y'=X'1+X'2 qui ne seront pas binomiales lorsque p1 sera différent de p2 et p'1 différent de p'2. Pour comparer les moyennes de Y/(n1+n2) et Y'/(n'1+n'2) on forme leur différence Z. Les ni et n'i étant supposés suffisamment grands et les variables aléatoires Xi et X'i étant supposées indépendantes, Z suivra à peu près une loi normale centrée (moyenne nulle) dont il faudra estimer la variance. On aura :

var Z=var(Y)/(n1+n2)² + var(Y')/(n'1+n'2

avec var(Y)=var(X1+X2)=var(X1) + var (X2)

On a vu dans [1] que n1X1(1-X1)/(n1-1) était un estimateur sans biais de var(X1) et de même pour les autres variables aléatoires X2, X'1 et X'2.

On obtiendra ainsi une expression de cet estimateur que j'ai numériquement explicité dans l'exemple qui suit.

EXEMPLE 1

n1=n2=100 ; x1=65 x2=75 n'1=n'2=1000 ; x'1=590 x'2=675 en notant par le caractère minuscule correspondant les valeurs prises par les variables aléatoires Xi et X'i sur l'expérience.

 

Test par Z : La variance sera estimée sans biais par Z. La probabilité associée au test sera 2,01% .

Le calcul de la valeur estimée de la variance de Z se fait ainsi :

[100x65(1-65/100)/99+100x75(1-75/100)/99]/200² +

[1000x590(1-590/1000)/999+1000x675(1-675/1000)/999]/2000²

 

Test par W : L'estimateur de la variance est W avec les notations de [1]. Probabilité associée au test : 2,76% avec un seul biais.

Le biais vient du fait que Y=X1+X2 et Y'=X'1+X'2 sont considérées comme étant binomiales alors qu'elles ne le sont pas. Les valeurs prises par Y et Y' sont y=140 et y'=1265.

 

Test par V : V a été défini dans [1]. Probabilité associée au test : 2,91% avec 3 biais.

L'un est le biais du test W. De plus, en prenant V comme estimateur de la variance on considère que Y+Y' est binomiale alors que ce n'est pas le cas, ce qui introduit 2 biais.

 

Test par OR : test par l'odds ratio : OR=1,356 avec la probabilité associée au test : 2,945%

 

RÉCAPITULATIF :

 

n1=n2=100 

Test par Z

0 biais

Test par W

1 biais

Test par V

3 biais

Test par OR

x1=65 x2=75 n'1=n'2=1000 ; x'1=590 x'2=675

2,01%

2,76%

2,91%

OR=1,356   2,945%

x1=85 x2=95  n'1=n'2=1000 ; x'1=770 x'2=880

4,62/10000

5,285/10000

3,43/1000

OR=1,95   3,8/1000



CONSTATS

Le test Z est certainement le meilleur possible et peut donc servir de référence pour apprécier les 3 autres, c'est à dire, au moins sur cet exemple, l'importance que pourrait pendre ces biais.

Au moins sur cet exemple numérique on constate que les résultats vont en se dégradant du test Z au test OR, celui avec l'odds ratio qui donne le moins bon résultat comme dans les exemples précédents.

Ici le test Z donne un résultat significatif au seuil bilatéral de 5%, ce qui n'est pas le cas pour les 3 autres. Le rapport entre la probabilité du test OR et la probabilité référence du test Z est 1,37.

Le test OR est moins bon que les précédents. Une partie du biais est sans doute liée au passage à la forme multiplicative et aux approximations par la loi normale.Mais une autre est de même nature que pour le test W par rapport au test Z.

 

EXEMPLE 2

Prenons les données des exemples 1 et 5 de mon article [1], soit n1=n2=100, x1=85, x2=95 ; n'1=n'2=1000, x'1=770, x'2=880. Les résultats sont dans le tableau ci-dessus (dernière ligne).

Là encore on observe la même dégradation des résultats à partir du test référence, le test Z. Sur cet exemple, le test de l'odds ratio est encore le moins bon. Nettement moins bon d'aileurs que le test référence puisque la probabilité par ce test Z est 8,4 fois plus petite que par le test OR.



Effets d'une répartition non uniforme des témoins

Dans les exemples précédents, chaque cas recevait le même nombre de témoins, 10 en l’occurrence. Que peut-il se produire lorsque chaque cas n'a plus le même nombre de témoins ? Il n'y aura pas de conséquences particulières quand le nombre de cas et le nombre de témoins associés suivent des lois binomiales. Par contre, cela peut avoir beaucoup d'importance lorsque ce n'est plus le cas. On va étudier le problème sur des exemples quand le nombre de cas sera une somme de 2 lois binomiales et de même pour le nombre de témoins.

Je prendrai toujours n1=n2=100 ; x1=65 et x2=75. Les résultats sont rassemblés dans le tableau ci-dessous.



n1=n2=100  ; x1=65 x2=75

ESSAIS

Test Z

0 biais

Test W

1 biais

Test V

3 biais

Test OR

n'1=500  ; n'2=1000 ;

x'1=295 ; x'2=675

 6,17%

 6,24%

6,83%

OR =1,275

6,87%

n'1=n'2=500

x'1=295 x'2=337,5

 2,96%

 3,00%

3,44%

OR=1,36

3,47%

n'1=1000 ; n'2=500

x'1=590  ; x'2=337,5

0,93%

0,95%

1,24%

OR=1,44

1,27%

n'1=n'2=750

x'1=442,5 ; x'2=506,25

2,58%

 

2,62%

3,08%

OR= 1,356

3,12%



Essai 1 : j'associe 500 témoins aux 100 cas de X1 et 1000 pour ceux correspondants à X2. Je conserve les mêmes proportions de témoins vaccinés, soit x'1=590/2=295 et x'2=675. Les 4 probabilités tests dépassent toutes 6%, très nettement supérieures à celles obtenues auparavant avec 1000 témoins pour chacun des 100 cas.

 

Essai 2 : je prends 500 témoins pour chacun des 2 groupes. x'1=295 et x'2=675/2=337,5. Les probabilités ne dépassent pas 3,47% alors qu'il n'y a en tout que 1000 témoins au lieu de 1500. On avait vu que, quand le nombre de témoins diminue les probabilités tests devraient s'éloigner de la meilleure valeur (ici plus grandes) or c'est l'inverse ici, pourquoi ?

Dans l'essai 1, en accordant 2 fois plus de témoins au second groupe qu'au premier pour le même nombre de cas, on donne plus de poids au second groupe. Ce dernier ayant davantage de témoins vaccinés, le taux de témoins vaccinés va s'accroitre : il était de (590+675)/2000=0,6325 pour devenir (395+675)/1500=0,7133.

Dans l'essai 2, en "sacrifiant" 500 témoins on rétablit l'équilibre, le taux de témoins vaccinés revient à 0,6325.

 

Essai 3 : conservons 1000 témoins dans le premier groupe et prenons seulement 500 témoins dans le second. On va ainsi donner plus de poids au premier groupe dont les témoins sont moins vaccinés que ceux du second. Le taux de témoins vaccinés va ainsi se réduire, provoquant une réduction de la probabilité test. Effectivement, elle oscille entre 0,93% et 1,27% selon les tests, valeurs plus faibles que pour le test initial avec 1000 témoins pour chaque groupe. Pourtant, il y a seulement 1500 témoins contre 2000.

 

CONCLUSION

Pour que le test ait une chance d'être fiable il sera impératif que le nombre moyen de témoins

par cas soient le même dans les 2 groupes



Tout déséquilibre de ces moyennes donnera plus de poids au groupe

ayant le nombre moyen de témoins par cas le plus élevé.



Ces variations peuvent être suffisantes pour changer la conclusion du test


En effet, Les valeurs extrêmes sont 0,93% et 6,87% alors que les données ne sont pas  excentriques. On constate que 0,93% ferait conclure à un test largement significatif alors que 6,87% ferait conclure qu’il ne l’est pas du tout ...

Parmi celles obtenues, la valeur la plus fiable  est celle avec :

     10 témoins par cas pour chacun des 2 groupes

   le test Z qui donne 2,01%.

Avec seulement 5 témoins par cas au lieu de 10 le test Z donne 2,96%



[1] http://questionvaccins.canalblog.com/archives/2014/02/09/29163341.html

[2] http://questionvaccins.canalblog.com/archives/2009/07/09/14342043.html (aller sur l'oddds ratio OR)

Articles déjà publiés sur la comparaison de 2 proportions :

 

06 février 2014

Comparaison de deux proportions : un fort risque d'occulter un signal !

09 février 2014

Comparaison de 2 proportions : un test doublement biaisé !

22 janvier 2014

L'intervalle de confiance, cet inconnu !

 

 

A suivre : applications de ces résultats à des études cas-témoins publiées utilisant un ajustement logistique conditionnel pour l'odds ratio.

Il  y a aussi cet article [3] qui décrit l'usage de l'odds ratio en sociologie. Il est utilisé comme simple indicateur sans aucun test statistique et qui plus est, sur des pourcentages sans tenir compte des tailles des échantillons alors que ce sont des nombres absolus qui devraient être utilisés ... C'est encore un autre problème !
[3]  http://quanti.hypotheses.org/603/ 

Extraits :

"pour certains, si les odds ratio se sont imposés depuis les années 1990, en particulier parmi les sociologues de l’éducation, qui en font une grande consommation, ce ne serait pas parce qu’ils mesureraient plus correctement les variations des inégalités, mais parce qu’ils les mesureraient… de façon plus optimiste !

C’est tout le sens de la « controverse » sur la mesure des inégalités, qui traverse la sociologie française depuis le milieu des années 1980."

"Imaginez que 50% des enfants de cadres obtiennent le bac (comme c’était le cas dans les années 1960). Dans ce cas, 50% d’entre eux ne l’obtiennent pas : on dira qu’il y a autant d’enfants de cadres qui obtiennent le bac que d’enfants de cadres qui ne l’obtiennent pas. Maintenant, si 90% des enfants de cadres obtiennent le bac (comme c’est donc le cas désormais), alors 10% des enfants de cadres ne l’obtiennent pas, et dans ce cas, il y a 90 divisé par 10 = 9 fois plus d’enfants de cadres qui obtiennent le bac que d’enfants de cadres qui n’obtiennent pas le bac. Ce chiffre, c’est « l’odds », ou « chance relative », ici d’obtenir le bac plutôt que de ne pas l’obtenir, qui s’obtient donc très simplement en divisant la probabilité d’être ou de faire, ou de réussir quelque chose, par la probabilité contraire de ne pas l’être, ne pas le faire ou y échouer.

Pour les enfants de cadres, la chance relative d’obtenir le bac est de 9 (contre 1). Et pour les enfants d’ouvriers ? Désormais, 45% des enfants d’ouvriers obtiennent le bac, et donc 55% d’entre eux ne l’obtiennent pas. Donc leur chance relative d’avoir le bac est de 45 divisé par (100-45), soit 45 divisé par 55, ce qui donne 0,81. Ca veut dire que les enfants d’ouvriers avaient 0,81 fois plus de chances d’obtenir le bac que de ne pas l’obtenir.

Eh bien « l’odds ratio », c’est le « rapport » (ratio) entre les chances relatives (odds) des uns et celles des autres, donc ici le rapport entre les chances relatives des enfants de cadres d’avoir le bac et celles des enfants d’ouvriers : ici, ça donne 9 divisé par 0,81 = 11. Autrement dit, les enfants de cadres ont 11 fois plus de chances que les enfants d’ouvriers d’obtenir le bac plutôt que de ne pas l’obtenir. Et il y 50 ans ? Même calcul, cette fois simplifié : 45 / (100 – 45) divisé par 5 / (100 – 5) = 15,5. Donc, il y a 50 ans, les enfants de cadres avaient 15,5 fois plus de chances que les enfants d’ouvriers d’obtenir le baccalauréat que de ne pas l’obtenir.

Conclusion: les inégalités d’obtention du baccalauréat, telles que mesurées par les odds ratio, ont diminué en 50 ans."

La Sociologie ... J'adore !!!

Ils n'ont pas l'air de savoir que s'il y a 10 fois plus d'enfants d'ouvriers que de cadres, ce n'est pas la même chose de comparer 90 et 45 parmi 100 ou 90 parmi 100 et 45 parmi 1000.

 

Posté par BernardGue à 21:49 - Commentaires [0] - Permalien [#]

09 février 2014

Comparaison de 2 proportions : un test doublement biaisé !

 

En lançant 100 fois une pièce de 1 euro j'ai obtenu 60 piles alors qu'en lançant 150 fois une pièce de 2 euros j'en ai obtenu 75. Je cherche à savoir si les 2 pièces ont la même probabilité de tomber sur pile.

Le test classique

On raisonne habituellement ainsi  :  si les 2 pièces ont la même probabilité p de tomber sur pile, on obtient la meilleure estimation possible pour p en prenant (60+75) / (100+150)=0,54.

 

Sous une forme plus théorique, les variables aléatoires X et X' donnant les nombres de piles obtenus au cours de ces 2 expériences suivent des lois binomiales indépendantes B(100 ; p) et B(150 ; p')p et p' sont les probabilités théoriques pour ces pièces de tomber sur pile. Les moyennes (espérances) sont 100p et 150p' alors que les variances sont 100 p(1-p) et 150p'(1-p'), les valeurs observées pour X et X' étant x=60 et x'=75, notant par une lettre minuscule les valeurs prises par les variables aléatoires notées avec des majuscules.

On considère alors la variable aléatoire donnant la différence des 2 proportions

Y= X/100-X'/150 qui a pris la valeur y=60/100-75/150=0,1.

On aura E[X/100-X'/150]=p-p'=0 si on admet p=p'.

La notation E(U) exprime l'espérance, c'est à dire la moyenne attendue de la variable aléatoire U.

La variance de X/100 vaut var(X/100)/100²=100p(1-p)/100²=p(1-p)/100. De même, var(X'/150)=p'(1-p')/150.

Aussi, la variance de Y sera la somme de ces 2 variances. Si p=p'  on obtient

 var(Y)=p(1-p)[1/100+1/150].

En remplaçant p par sa valeur estimée 0,54, la variance de Y pourra être estimée par  

0,54x0,46(1/100+1/150)=0,00414

 

Ainsi, on admet que la variable aléatoire Y suit une loi normale centrée (moyenne nulle) et de variance estimée 0,414. La valeur observée pour Y étant connue (0,6-0,5=0,1), on peut calculer la probabilité d'observer pour Y une valeur au moins égale à 0,1. Elle vaut 6,01% qui n'est pas significatif d'une différence entre les valeurs théoriques p et p'.

 

Les 2 biais pour l'estimation de la variance

On estime en réalité var(Y) par la variable aléatoire V=U(1-U)[1/100+1/150] avec U=(X1+X2)/250. Il faudrait que V soit ce qu'on appelle un estimateur de var(Y), ce qui signifie, par définition, E(V)=var(Y). Or la variable aléatoire V est doublement biaisée, c'est à dire que E(V) n'est pas égale à var(Y) et ce pour 2 raisons différentes. Ce sont ces biais dont je vais maintenant essayer de mesurer l'impact sur les tests.

 

On obtient un estimateur sans biais W de var(Y) en prenant :

W=(X/n)*(1-X/n)/(n-1) + (X'/n')*(1-X'/n')/(n'-1)

où les variables aléatoires X et X' sont binomiales B(n ; p) et B(n' ; p').



L'estimateur usuellement utilisé étant

V=U(1-U)/n+ U(1-U)/n' avec U=[X+X']/(n+n')

Pour ne pas trop décourager les lecteurs, je vais d'abord montrer sur des exemples numériques les différences obtenues dans les tests en utilisant V ou W. En annexe, je donnerai une démonstration de ces résultats.

 

EXEMPLE 1

Prenons n=100, x=85, n'=1000, x'=770 (x et x' sont les valeurs prises par les variables aléatoires X et X' sur l'expérience).

En testant en estimant la variance de Y par V on obtient la probabilité 3,34% non significative au seuil 5% car supérieure à 2,5%.

En testant en estimant la variance de Y par W on obtient la probabilité 1,83%, significative au seuil 5% car inférieure à 2,5%. 

 

La différence entre les 2 tests est suffisante pour changer la décision du test !!!

On voit ainsi qu'il n'est pas possible de négliger l'affaire en se contentant d'utiliser V comme estimateur sous le seul prétexte qu'il serait plus commode et, surtout sans doute, parce que c'est l'usage comme l'illustrent les nombreux cours de statistique qu'il est possible de trouver sur internet.

 Additif du 5 mai 2014

Exemple avec des données sur le vaccin DTP

 

J'ai été sollicité par l'association E3M pour effectuer les tests statistiques correspondants aux données suivantes :

 1- au cours d'une période donnée il avait été notifié 23 événements indésirables (EI) alors que 213224=n doses avaient été vendues au cours de la même période ;

 2- au cours d'une autre période ce sont 6 EI qui furent notifiés alors qu'il y avait eu 552857=n' doses vendues.

 Avec ces données, peut-on accepter que la probabilité de notification d'un EI avait été la même pour les 2 périodes ?

 Le test va donc consister à comparer les 2 proportions observées 23/n et 6/n' au moyen d'une loi normale centrée (moyenne 0) et dont la variance sera estimée par  l'estimateur sans biais W qui prend ici la valeur :

 W=(23/n)(1-23/n)/(n-1)+(6/n')(1-6/n')/(n'-1)

La probabilité d'obtenir un écart au moins aussi grand que celui obtenu avec les valeurs observées 23/n et 6/n' est alors

1,16/100000

qui est évidemment très, très significative et devrait faire rechercher une cause non aléatoire pouvant expliquer de tels écarts.

 

Remarque : en utilisant l'estimateur biaisé V on obtiendrait la probabilité 3,1 sur 10 milliards qui serait évidemment encore plus significative si on retenait cette valeur.

Cet exemple illustre bien l'importance qu'il y aurait à utiliser systématiquement l'estimateur non biaisé plutôt que l'estimateur usuel. Ici ce n'est évidemment pas la division par n-1 plutôt que n qui modifie le résultat mais l'écart important entre n et n' ainsi qu'entre 23/n et 6/n'.

     Bernard Guennebaud

 Fin de l'additif

 Des écarts aussi importants ne s'observent pas toujours comme vont le montrer d'autres exemples :

AUTRES EXEMPLES

2- n=100 avec x=45 ; n'=200 avec x'=110. On obtient 5,114% avec V et 5,109% avec W, différences tout à fait négligeable. On peut noter ici que 1-45/100=0,55=110/200. Aussi, l'écart provient seulement du remplacement de n et n' par n-1 et n'-1 qui devient négligeable quand n et n' sont assez grands.

3- n=100 avec x=55 ; n'=1000 avec x'=450. On obtient 2,785% avec V et 2,82% avec W. Ici, on observe que 1-x'/n'=x/n. C'est ce qui explique que les résultats sont très proches.

 4- n=100 avec x=85 ; n'=100 avec x'=77. Les proportions sont les mêmes que dans l'exemple 1, mais n'=100 au lieu de 1000. On trouve 7,46557 % avec V contre 7,4615%avec W. On voit sur cet exemple l'importance du décalage entre les tailles des 2 échantillons comme 100 et 1000.

 

Ces observations suggèrent que les écarts importants seraient liés tout particulièrement à 2 facteurs  simultanés :

1- Un écart suffisant entre les deux proportions x/n et x'/n' mais aussi entre x/n et 1-x'/n' comme 0,85 et 0,77 dans l'exemple 1.

2- Un déséquilibre important entre n et n' comme 100 et 1000 dans l'exemple 1. Cette situation se rencontre tout particulièrement dans les études cas-témoins où les témoins sont généralement beaucoup plus nombreux que les cas, comme par exemple pour la fameuse étude Hernan (14 septembre 2004) sur le lien entre la vaccination hépatite B et la sclérose en plaques où il y avait 10 témoins par cas.

 

EXEMPLE 5

Pour confirmer le rôle de ces 2 critères prenons x=95 et x'=880 avec n=100 et n'=1000. On obtient 1,77% avec V contre 0,19% avec W qui est significatif au seuil 1% (<0,5%) alors que le test n'est pas significatif à ce seuil si on utilise V.

Remarque: on obtiendrait exactement les mêmes résultats en remplaçant les valeurs observées par leurs complémentaires à 100 et 1000, soit 5 et 120 sur cet exemple. En effet, les variances ne changent pas, de même que la différence des proportions.

EXEMPLE 5 bis

Échangeons les proportions : 88 parmi 100 contre 950 parmi 1000. Avec V la probabilité sera 0,19% alors qu'avec W elle sera 1,80%. L'écart entre les 2 valeurs reste aussi important même si sons sens est inversé.



Pour essayer de comprendre ...

Le test mesure la distance entre la moyenne théorique égale à 0 par hypothèse et la valeur observée qui, sur le dernier exemple est :

0,95-0,88=0,07.

Cette distance peut être évaluée en prenant pour unité l'écart-type, la racine carrée de la variance. Plus la variance sera faible et plus cette distance sera grande, rendant plus faible la probabilité associée au test. Précisons avec l'exemple 5 :

Quand on utilise W, 0,95x0,05 sera divisé par 99 et 0,88x0,12 le sera par 999. Aussi, cette dernière quantité sera très faible par rapport à la première.

Quand on utilise V, 95+880=975 sera divisé par 1100 soit 0,886. L'estimation de la variance sera 0,886x0,114/100 + 0,886x0,114/1000. Le dernier terme sera aussi presque négligeable par rapport au premier.

En conséquence, l'essentiel va se jouer entre 0,95x0,05/99=0,00048 et 0,886x0,114/100=0,00101 qui est 2,1 fois plus grand. Le rapport des 2 variances est 1,89, ce qui confirme qu'en utilisant V dans ces conditions on obtient une évaluation largement surestimée de la variance.

Plus précisément, comme 880 est beaucoup plus grand que 95, il écrase le 95 : dans l'estimation de la variance par V, on remplace en fait pratiquement 0,95x0,05/99 par 0,886x0,114/100 qui est très proche de 0,88x0,12/100. Or 0,88x0,12 correspond aux 880 cas parmi 1000, sauf qu'on divise alors par 100 et non plus par 1000 !!!

 

En utilisant V pour estimer la variance ce seront les résultats obtenus

sur l'échantillon le plus grand

qui auront le poids le plus élevé dans cette estimation

J'ai quand même trouvé un site où cet aspect important est mentionné page 2 :

Cette estimation combinée de la variance « permet d'attribuer plus de poids à l'échantillon de plus grande taille. En revanche, si la différence entre les deux proportions n'étaient pas nulle il ne faudrait pas faire d'estimation combinée »

Mais pour un site montrant que  le problème a été compris, combien d'autres qui n'en ont point conscience... Notons qu'on ne sait pas à l'avance si les 2 proportions théoriques sont différentes.

 Additif (14 février 2014)

Je viens d'en trouver un autre qui donne la bonne formule pour l'estimation de la variance. Voir la partie manuscrite.

Fin additif

 

Comment on en est arrivé à une telle situation ?

 

Pour une part on peut sans doute lier cette affaire à la facilité de manipulation des lois normales :

 

Soient X et X'  2 variables aléatoires qui suivent des lois normales N(m ; v) et N(m' ; v') caractérisées par leurs moyennes m et m' ainsi que par leurs variances v et v'. Si X et X' sont indépendantes, X+X' suivra la loi normale N(m+m' ; v+v'). Dans la situation étudiée ici, ces lois normales sont censées approximer des lois binomiales. Mais cela reste implicite, aussi on oublie facilement l'origine binomiale qui pourtant va resurgir par l'expression de la variance np(1-p).

La variable aléatoire X/n aura pour espérance m/n=p et pour la variance v on aura

v=np(1-p)=m(1-m/n)

On peut comprendre que si X ne suit pas une loi binomiale il n'y aura guère de chance pour que cette relation liant m, v et n soit satisfaite.

 

 CONSÉQUENCE

C'est exactement la situation dans une étude cas-témoins où les témoins sont beaucoup plus nombreux que les cas. Le test consistant à comparer les proportions de vaccinés (d'exposés) dans les 2 groupes, si on utilise le test classique avec V pour estimer la variance, on pourra donner un poids trop important aux résultats obtenus sur les témoins, ce qui entrainera un test ayant moins de chances d'être significatif.

J'étudierai ce problème dans un autre article à venir. En attendant, l'étude Tardieu 2007 sur la sclérose en plaque chez les enfants vaccinés contre l'hépatite B donne 143 cas dont 80 vaccinés contre 1122 témoins dont 609 vaccinés. Les proportions 80/143=0,5594 et 609/1122=0,54278 étant très proches, malgré la différence importante entre les nombres de cas et de témoins, les tests par V et par W devraient donner des résultats très proches. En effet, par V on trouve 0,35324 et 0,35318% par W.

Sur les sites ci-dessous, entre-autres, on pourra constater que le problème n'est pas soulevé.

 

En conclusion, on devrait s'efforcer de réserver le test de comparaison de 2 proportions

à des lois binomiales.

 

On peut cependant noter que si l'échantillon de n individus a été choisi de façon aléatoire dans une population A ayant une proportion p de vaccinés, la variable aléatoire X donnant le nombre de vaccinés pourra être considérée comme binomiale B(n ; p).

Chacun des n cas choisis aura alors une probabilité p d'être choisi,

ce qui est différent  de sa probabilité d'avoir été vacciné.

Encore faut-il que les n cas de l'échantillon puissent être considérés comme ayant été

choisis de façon aléatoire,  ce qui ne sera pas toujours acceptable.

  

http://www.ann.jussieu.fr/gentes/documents/cours2.pdf page 23

 

http://rfv.insa-lyon.fr/~jolion/STAT/node115.html

 

http://udsmed.u-strasbg.fr/labiostat/IMG/pdf/proportions-2.pdf

 

http://www.jybaudot.fr/Inferentielle/propindep.html (une nuance cependant : « peut être formalisée ainsi ... »

 

http://benestnao.perso.sfr.fr/FicExcelZippes&pdf/Test2Parametres.pdf

 

http://www.math.univ-toulouse.fr/~san/proba6.pdf page 3

 

http://jebrane.perso.math.cnrs.fr/ps2/Tests_param%E9triques_de_comparaison.pdf page 17

 

http://www.med.univ-montp1.fr/enseignement/cycle_2/Autres-Mod-Oblig/MB6/commun/polycop_biostat_tome_1_methodes_statistiques.pdf page 62

 

 

ANNEXE

 

Définition des variables de Bernoulli

 Une variable de Bernoulli X est une variable aléatoire qui ne peut prendre que les valeurs 0 et 1. Si p est la probabilité qu'elle prenne la valeur 1, X sera une loi binomiale B(1 ; p). On a bien sûr X²=X. La moyenne de X ( son espérance) sera

 

E(X)= 0x(1-p) + 1xp=p.

 

Sa variance sera, selon une formule générale : var(X)=E(X²)-E(X)²

 

qui dans ce cas particulier devient

 

var(X)=E(X)-E(X)²=p-p²=p(1-p)

 

Soit maintenant X une variable aléatoire binomiale B(n ; p). Par définition, elle est la somme de n variables de Bernoulli X1, … Xn indépendantes et de même loi. Xi sera donc B(1 ; p). L'espérance de X sera la somme des espérances des Xi soit E(X)=np. Les variables aléatoires Xi étant indépendantes, la variance de X sera la somme des variances des Xi soit var(X)=np(1-p).

 

Estimateur d'un paramètre m

 

La variable aléatoire Y est un estimateur de la valeur numérique m (généralement inconnue) si E(Y)=m. En conséquence, X sera un estimateur de l'espérance np.

 

On a aussi besoin d'un estimateur de la variance de X. On a :

 

E[X(1-X/n)]=(n-1)p(1-p)

 

Donc X(1-X/n) n'est pas un estimateur de var(X). On dit qu'il est biaisé.

 

Démonstration

 

Soit U=X/n=(X1+...+Xn)/n la variable aléatoire donnant la moyenne des Xi. On aura alors

Z=X(1-X/n)=nU(1-U)=nU-nU²=X1+... +Xn – [X1²+... +Xn² + ∑XiXj ] /n avec i≠j.

 

Z=[nX1+ … +nXn - (X1²+... +Xn² + ∑XiXj) ] /n

 

Comme Xi²=Xi on aura Z=[(n-1)(X1+... +Xn) - ∑XiXj ]/n  De plus, il y a n(n-1) couple (i ; j) avec i ≠ j d'où 

E(Z)=[ n(n-1)p - ∑p² ]/n = n(n-1)[p-p²] /n=(n-1)p(1-p).

 

Aussi, en corrigeant X(1-X/n) par n/(n-1)  :

 

La variable aléatoire X étant binomiale B(n ; p) on aura

E[nX(1-X/n)/(n-1)]=np(1-p)=var(X)

La variable aléatoire nX(1-X/n)/(n-1) est un estimateur sans biais de var(X)

 

 

Cependant, si n est un peu grand, le rapport n/(n-1) sera proche de 1 et le biais sera négligeable si on utilise X(1-X/n) comme estimateur de var(X).

 

C'est le premier biais annoncé. Il en existe un second dont l'impact peut être beaucoup plus important comme on l'a vu sur les exemples 1 et 5.

 

Estimateurs pour la différence de deux proportions

Soit X et X' deux variables aléatoires indépendantes binomiales B(n ; p) et B(n' ; p').

On a E(X/n)=E(X)/n=p et de même E(X'/n')=p' 

Aussi  E[X/n – X'/n']= p - p'

La variable aléatoire Y=X/n – X'/n' est donc un estimateur de p-p'.

Cherchons maintenant un estimateur pour la variance de Y. On a 

var(X/n)=var(X)/n²=np(1-p)/n²=p(1-p)/n.

Comme var(Y)=var(X/n)+var(X'/n') on aura

Var(Y)=p(1-p)/n+ p'(1-p')/n'

On obtiendra un estimateur sans biais de var(Y) en prenant

Z=(X/n)(1-X/n)/(n-1) + (X'/n')(1-X'/n')/(n'-1)

E(Z)=var [X/n – X'/n']


Démonstration

On a en effet E[X(1-X/n)]=(n-1)p(1-p) et donc

E(X/n)(1-X/n)=(n-1)p(1-p)/n=(n-1)p(1-p)/n

En divisant par n-1 on éliminera le n-1 du numérateur. D'où le résultat.

 

V n'est pas estimateur de la variance quand p p' 

 

Il est possible de voir précisément et facilement ce qui se produit en prenant pour X et X'  des variables de Bernoulli. On veut estimer

 

var(X/1-X'/1)=var(X+X')=var(X) + var(X')

 

On a dans ce cas var(X) +var(X')=p(1-p)+p'(1-p')=p+p'- p²- p'²

 

Avec U=(X+X')/2 on aura V=U(1-U)[1/1+1/1]=2U(1-U) soit

 

V=(X+X')[1-(X+X')/2] =(X+X') – (X+X')²/2=X+X' – (X² +X'² + 2XX')/2

 

V=X/2 + X'/2 – XX'

 

2V=X+X' - 2XX'

 

On aura E(2V)=p+p '- 2pp' = p(1-p') + p'(1-p) au lieu de p(1-p)+p'(1-p')

 

.On aura E(2V) – var(X-X')= p²+p'²- 2pp'=(p-p')²>0 ou encore

 

E(2V)/var(X-X')=1+(p-p')²

 

E(2V) ne sera donc pas un estimateur de var(X-X').

 

Exemple numérique : p=0,85 et p'=0,7  donnent 1+(p-p')²=1,0225

 



 

 

Posté par BernardGue à 23:16 - Commentaires [0] - Permalien [#]

06 février 2014

Comparaison de deux proportions : un fort risque d'occulter un signal !

 

 Comparer 2 moyennes ?

                  DANGER, C'EST RISQUÉ !!!

J'ai lancé 200 fois des pièces françaises pour obtenir 100 piles. J'ai fait de même avec des pièces allemandes et j'ai aussi obtenu 100 piles. Inutile d'aller chercher un test statistique pour conclure que, sur cette expérience, on ne peut rejeter l'hypothèse que les pièces allemandes et françaises auraient la même probabilité de tomber sur pile !

Il existe cependant un test qui permet de le faire. En tapant comparaison de deux proportions sur un moteur de recherche vous trouverez de nombreux cours universitaires sur ce sujet *. Mais aucun ne vous dira ce que je vais essayer d'expliquer ici puis, dans un autre article à suivre, sur les 2 biais de ce test très classique.

* Par exemple Jussieu :  http://www.ann.jussieu.fr/gentes/documents/cours2.pdf page 23

* Ou encore Rennes  page 24 : http://perso.univ-rennes1.fr/jean-christophe.breton/Fichiers/stat_IUT.pdf

Pour obtenir 100 piles en 200 jets de pièces françaises, j'avais d'abord lancé 100 fois une pièce de 1 euro pour trouver 40 piles. En réalité, la probabilité théorique pour cette pièce, de tomber sur pile est 40%. J'avais prolongé l'expérience en lançant 100 fois une pièce française de 2 euros et j'avais obtenu 60 piles. En réalité, cette pièce avait 60% de chances de tomber sur pile à chaque jet.

De même, en lançant 100 fois une pièce allemande de 1 euro, j'avais obtenu 60 piles alors que la probabilité théorique de cette pièce pour tomber sur pile est 60%. J'avais terminé par une pièce allemande de 2 euros qui avait donné 40 piles en 100 lancers alors que sa probabilité théorique de donner pile était 40%.

Mais si je compare les résultats donnés par les pièces de 1 euro, j'ai 40 piles sur 100 pour la française contre 60 sur 100 pour l'allemande. A vue on se doute qu'un tel résultat pourrait être pour le moins significatif d'une différence entre les 2 pièces pour ce qui est de leur probabilité de tomber sur pile. On teste classiquement l'hypothèse nulle exprimant que cette probabilité est la même pour les 2 pièces (leur différence est nulle). Il donne 0,24% de chances d'obtenir un écart au moins aussi grand que celui qui a été observé. On est ainsi conduit à rejeter l'hypothèse nulle et à accepter qu'il y aurait une différence entre les 2 pièces, ce qui est le cas puisque les probabilités théoriques sont 40% pour l'une et 60% pour l'autre.

Force est de constater que ce signal fort n'apparaissait pas

dans la comparaison cumulée

entre les 2 pièces allemandes et les 2 pièces françaises



On arriverait évidemment au même constat en comparant les pièces françaises et allemandes de 2 euros.

 

Cela est connu sous le nom de paradoxe de Simpson. Voir mon article :

 

Le paradoxe de Simpson en statistiques médicales : un match de Coupe Davis !

 .

Faut-il craindre qu'au cours d'une analyse statistique de données on puisse

laisser passer, tout à fait involontairement, un signal fort ?

On verra que la réponse est OUI.

Comment faire alors pour en réduire le risque ?

 

Analysons d'abord l'exemple précédent

A chaque jet, chaque pièce a la même probabilité de tomber sur pile, 0,4 ou 0,6 selon les pièces. Ces probabilités théoriques ne dépendent pas du nombre de jets. Quand on comparait les pièces de 1 euro entre-elles, on cherchait seulement à tester leur égalité.

Par contre, quand on cumule les jets des 2 pièces françaises, on fait dépendre la moyenne théorique de la taille des échantillons : ce sera ici 50% car on a lancé les 2 pièces le même nombre de fois. Mais si la pièce de 1 euro est lancée 100 fois et celle de 2 euros 200 fois, on obtient (40+2x60)/300=53,3% . Si celle de 1 euro est lancée 200 fois et celle de 2 euros 100 fois on obtient 46,7%.

En conséquence, en testant dans ces conditions,

on fera dépendre l'hypothèse à tester des tailles relatives des échantillons entre-eux.



Plus généralement, les moyennes théoriques auront les formes suivantes :

(n1p1 + n2p2)/(n1+n2) et (n'1p'1 + n'2p'2)/(n'1 +n'2) dont on cherche à tester l'égalité. On voit  qu'il ne sera pas possible de tester ainsi les hypothèses p1=p'1 et p2=p'2 alors que ce sont ces hypothèses qui sont essentielles et qu'il faudrait tester. En effet, même si ces 2 moyennes étaient égales avec n1=n'1= n2=n'2 , ce qui donne p1 +p2=p'1 +p,'2 on pourrait avoir  p1 différent de p'1 et pdifférent de p'2 : il suffit de prendre  p'1= p1-a et p'2=p'2+a

 

Une histoire de choux bio et pas bio ...

Un panier de 10 choux contient 7 choux pas bio à 1 euro et 3 choux bio à 2 euros, soit 13 euros le lot ; 1,30€ le prix moyen du choux.

Un lot de 100 choux contient 70 bio à 2€ et 30 pas bio à 1€, soit 170€ le lot ; 1,70€ le prix moyen du choux. On constate que le prix moyen est beaucoup plus cher dans le second lot alors que les choux sont au même prix.

Maintenant le marchand accorde 10% au second lot pour achat en gros, soit 153€ et donc 1,53€ le prix moyen qui est encore largement supérieur à 1,30€. La conclusion pourrait être que les choux du second lot sont plus chers que ceux du premier alors qu'ils sont 10% moins chers.

Voilà ce qui peut se produire quand on teste sur des moyennes obtenues avec des données non homogènes !

Remarque

On peut noter qu'ici p1 et p2 ne sont pas des probabilités de lois binomiales où les pi sont des nombres entre 0 et 1 mais les prix théoriques des choux bio et non bio. Cependant, la formule donnant les prix moyens est la même :

(7x1+3x2)/(7+3)=1,30 ;   (30x1+70x2)/(30+70)=1,70 ;     (30x0,9 + 70x1,80)/(30+70)=1 ,53

En reprenant les expressions générales, on peut facilement voir qu'il faudrait avoir n'1/n1=n'2 /n2 pour pouvoir assurer que la condition p1=p'1 et p2 =p'2 entrainera l'égalité des 2 moyennes sur les données cumulées. Par contre, la réciproque est fausse :

Sur l'exemple, avec p1=1 et p2 =2 l'égalité des 2 moyennes cumulées s'écrit :

(7x1+3x2)/10=(70p'1+30p'2)/100=(7p'1+3p'2)/10

soit  13=7p'1+3p'2  ou  3p'2 =13-7p'1

En choisissant p'1=0,88 par exemple, on obtient p'2=2,28.

Autrement dit, avoir (70xp'1 + 30 p'2)/(70+30)=1,30 ne garantit pas que p'1=1 et que p'2=2. Pour tester ces égalités il sera donc indispensable de dissocier. On peut cependant noter que si p'1=p1 alors p'2 =p2.

Un exemple avec le BCG

Il avait été démontré par de très nombreuses expérimentations animales que son efficacité dépendait beaucoup de la dose infectante. Aussi, son efficacité sur des enfants très fortement contaminés (un parent contagieux) est sans doute très inférieure à celle qu'il peut avoir sur des enfants exposés plus épisodiquement. Si on cherche à évaluer son efficacité dans une population d'enfants constituée de très exposés et de modérément exposés, le résultat observé sera directement sous la dépendance des proportions des 2 groupes. Si on se fonde sur le taux observé pour l'appliquer dans une autre population où ces proportions sont très différentes, on pourra faire une erreur d'appréciation.

Pour fonder en 2007 la nouvelle politique vaccinale par le BCG, avec la levée de son obligation pour les enfants, on s'était tout particulièrement appuyé sur une évaluation du nombre de cas évités par le BCG chez les enfants au cours des 6 années 1997-2002. Cette évaluation avait été faite en attribuant a priori un taux d'efficacité au BCG comme 50%. Mais aucune distinction ne fut faite entre les enfants fortement exposés et les autres alors que, pour les premiers, l'efficacité est sans doute bien moindre. Cette évaluation reposait sur au moins une erreur technique majeure : une absence de dissociation entre les enfants fortement et faiblement exposés avec des taux d'efficacité très différents pour la vaccination.

A suivre : les biais des tests de comparaison de deux proportions



Posté par BernardGue à 13:51 - Commentaires [0] - Permalien [#]



Fin »