Une étude cas-témoins (Mikaeloff-Tardieu) sur l'apparition de la sclérose en plaques après vaccination hépatite B chez des enfants montre qu'en fait les auteurs n'ont pas respecté une condition mathématique fondamentale quand la couverture vaccinale n'est pas homogène dans la population étudiée, à savoir : le nombre moyen de témoins par cas doit alors être le même dans le groupe des ''fortement vaccinés'' et dans celui des ''faiblement vaccinés''. Le non respect de cette condition ou la non vérification de celle-ci semble habituel dans les études épidémiologiques et validée par les mœurs.

 

Rappelons d'abord qu'en France une cohorte d'enfants nommée KIDSEP a été suivie sur une période de 10 ans entre 1994 et 2003 et jusqu'à 16 ans pour observer l'apparition d'une première atteinte démyélinisante centrale (ADC) et juqu'au 30 juin 2006 pour sa confirmation en scléroses en plaques (SEP). La date retenue pour les délais d'apparition après la vaccination est celle de la première atteinte. Trois études françaises ont été publiées sur les données collectées, deux en décembre 2007 et la troisième, qui fit grand bruit, le 8 octobre 2008.

La première a voulu étudier sur 30 enfants si la vaccination avait pu aggraver une première ADC apparue avant la vaccination. Pour les deux autres, les enfants étaient indemnes de toutes ADC avant la vaccination. Celle publiée en décembre 2007 [1] porte sur l'apparition de SEP au cours de la fenêtre d'observation et fait l'objet de cet article alors que celle de 2008 [2] regroupe l'ensemble des ADC et complète pour la SEP les résultats de 2007 (seul son résumé est en accès libre mais elle est présentée dans un diaporama  [3]).

 

Voir aussi sur ce blog mon autre article sur ces études avec un test significatif inattendu.

Et aussi mon  article "Le péché originel des études cas-témoins sur une population".

J'ai présenté un résumé de ces réflexions sous forme de communication affichée (poster) au congrès de la Sfsp, Société française de santé publique, à Lille,  les 2-4 novembre 2011.

 

L'étude [1] sur l'apparition de SEP chez des enfants indemnes de toute atteinte démyélinisante avant la vaccination avait enregistré 164 cas de SEP mais n'en avait retenu que 143 en raison d'informations insuffisantes sur le statut vaccinal de 21 cas. Il avait été prévu d'associer 12 témoins à chacun de ces 143 cas, soit 1716. Ces témoins étaient du même âge (plus ou moins 6 mois), du même sexe et de la même région. L'institut  CSA avait fourni aux auteurs 1705 témoins ayant en principe donné leur accord pour participer à l'étude. Mais, pour des raisons diverses, il n'en est resté que 1122, soit un tiers de défections : refus de participer à l'étude, absence de réponse malgré plusieurs relances, coordonnées inexactes, défaut de preuve du statut vaccinal. Ainsi, le nombre moyen de témoins par cas est seulement 7,85 au lieu de 12 comme prévu.

 

[1] Hepatitis B Vaccination and the Risk of Childhood-Onset Multiple Sclerosis

Yann Mikaeloff, MD, PhD; Guillaume Caridade, MSc; Mélanie Rossier, MSc; Samy Suissa, PhD; Marc Tardieu, MD, PhD

Arch Pediatr Adolesc Med. 2007;161(12):1176-1182.

 

Beaucoup plus grave, comme on va le voir, ces défections n'ont pas été homogènes puisque le nombre de témoins par cas s'étale entre 1 et 12, soit une dispersion énorme dont les conséquences sur la fiabilité de l'étude peuvent être catastrophiques comme je vais le montrer.

Le tableau ci-dessous regroupe des données de la publication 2007 sur la sclérose en plaques. J'ai indiqué en bleu et en italique des calculs effectués par moi-même. OR désigne l'odds ratio* :

 

 

Cas

Cas vaccinés

Témoins

Témoins vaccinés

OR

théorique

Probabilité

test

Témoins par cas

Total

143

80

1122

609

1,07

Ajusté 1,1

35,32%

33,18%

7,85

< 10 ans

42

10

357

97

0,84

67,89%

8,5

10-16 ans

101

70

765

512

1,12

31,62%

7,57

 

*Précisons ici que l'odds ratio ou rapport des cotes est le rapport entre la cote relative aux cas c'est à dire la division du nombre de cas vaccinés par le nombre de cas non vaccinés et la cote pour les témoins c'est à dire la division du nombre de témoins vaccinés par le nombre de témoins non vaccinés. Il peut donner une estimation du risque relatif. Aussi, le lecteur peu habitué aux odds ratio pourra traduire OR par risque relatif. Pour plus de détails sur l'odds ratio voir l'annexe d'un de mes articles.

Les auteurs ont calculé les odds ratio d'une autre façon en réalisant un ajustement des données observées pour tenter de mieux approcher les valeurs théoriques recherchées. Ils le font par régression logistique ou régression logistique conditionnelle. Les auteurs ont effectué cet ajustement en tenant compte des âges, du sexe et de la région. J'ai calculé des odds ratio par la formule théorique et non par ajustement. Je ne dispose d'ailleurs pas des détails permettant de le faire mais cela sera sans importance pour le constat principal qu'on va faire ici et qui est théorique. Les considérations théoriques ne sont pas frappées par les ajustements qui concernent les données observées.

 

Le test se fait en évaluant l'éloignement de l'odds ratio par rapport à la valeur théorique moyenne 1. Cette évaluation se fait en calculant la probabilité d'obtenir une valeur de OR au moins aussi grande que celle observée. Cela demande une modélisation par une loi de probabilités dite log-normale. C'est cette probabilité que j'ai calculée plutôt que de donner les intervalles de confiance comme le font les épidémiologistes. Cette probabilité donne une mesure plus précise de cet éloignement. L'écart est significatif quand elle est inférieure à 2,5% (ou supérieure à 97,5% côté vaccin ''protecteur'').

D'ailleurs, quand on connait la moyenne théorique, ce qui est le cas avec le test par l'odds ratio (elle vaut 1), l'intervalle de confiance n'est pas l'outil le plus adapté : il est moins précis que la probabilité test que j'ai calculée, ne permet pas les comparaisons entre différents tests et est de plus inutile. En effet, la borne de cet intervalle la plus éloignée de 1 a un intérêt purement contemplatif et se déduit de l'autre borne et de la valeur de l'OR. Voici ce qu'avait déclaré à ce sujet Dominique Costagliola au cours de son audition à la réunion internationale de consensus sur la vaccination hépatite B les 10-11 septembre 2003 en proposant un exemple ''pédagogique'' pour justifier l'intérêt de l'intervalle de confiance et de ces 2 bornes dans ce genre de tests :

« Le résultat d'une étude d'association s'exprime par un risque relatif ou un odds ratio assorti d'un intervalle de confiance. Ces éléments sont plus importants à considérer que la simple interprétation du test d'association en significatif/non significatif...un risque de 3 avec un intervalle (de confiance) [1,1; 600] nous dit que l'étude manque grossièrement de puissance puisque le risque peut être à peu près n'importe quoi »

Mais peut-on avoir un intervalle de confiance entre 1,1 et 600  avec un odds ratio de 3  ?  On peut aisément démontrer qu'un tel écart est très largement impossible : on sait que le carré de l'odds ratio est le produit des bornes de l'intervalle de confiance. Il faudrait donc que 9 soit égal à 600x1,1=660.  En fait, avec OR=3 et la borne inférieure égale à 1,1 la borne supérieure vaut 8,18.  Madame Costagliola, vous vouliez nous donner un exemple pédagogique montrant que c'est n'importe quoi. C'est parfaitement réussi !!!

Vous êtes classée parmi nos meilleurs épidémiologistes ... ce qui montre que nous le public qui subissons les conséquences des affirmations de nos experts, individuels ou en comités, nous avons intérêt à unir nos compétences pour vérifier leurs  déclarations péremptoires et cesser de les prendre pour des lois divines descendues du Sinaï.

 

Constats sur le tableau

1- Pour l'ensemble des 143 cas l'odds ratio théorique est très proche de l'odds ratio ajusté et les probabilités sont du même ordre (35% et 33%).

 

2- Pour les moins de 10 ans l'OR est inférieur à 1 (côté vaccin ''protecteur'') ce qui traduit le fait qu'il y a une proportion de cas vaccinés (10/42=23,8%) plus faible que la proportion de témoins vaccinés (97/357=27,2%).

 

3- A l'inverse, chez les 10-16 ans la proportion de cas vaccinés (70/101=69,3%) est supérieure à celle des témoins vaccinés (512/765=66,9%).

En conséquences, des proportions très éloignées (<30% et > 65%) et l'inversion de leur odre demandent de dissocier les moins de 10 ans des 10-16 ans pour étudier la question.

4- Notons aussi que le nombre moyen de témoins par cas est plus élevé (8,5) chez les moins de 10 ans que pour les 10-16 ans (7,57). Ce qui signifie qu'il y a eu plus de défections parmi les témoins associés aux 10-16 ans qu'aux moins de 10 ans.

Explication possible : ces derniers étaient plus jeunes quand leurs familles ont été sollicitées pour participer à l'étude, il y avait ainsi plus de chances pour que leur carnet de santé ait été conservé.

 

Nécessité d'une partition en plusieurs groupes

Le groupe des 10-16 ans est constitué des cas chez qui la première atteinte démyélinisante est apparue entre 10 et 16 ans. Mais certains ont pu avoir été vaccinés avant l'âge de 10 ans. Il y a aussi ceux dont la classe d'âge a été fortement vaccinée (75-80% environ) en classe de sixième entre octobre 1994 et juin 1998 et ceux dont les classes l'ont été beaucoup moins, soit qu'ils avaient dépassé la sixième quand débuta la campagne dans les collèges soit qu'ils n'y sont entré qu'à partir d'octobre 1998.

Les différences très importantes de couverture vaccinale entre ces groupes conduisent à en distinguer 2 chez les 10-16 ans : celui des ''fortement vaccinés'' et celui des ''faiblement vaccinés''. Les auteurs de l'étude n'ayant pas envisagé un tel distinguo, pourtant fondamental comme on va le voir, aucune indication n'a été publiée sur le nombre de cas ou de témoins dans ces groupes. Cependant, il est possible de se livrer à certaines investigations sur ces nombres inconnus.

 

Pour cela désignons par T' et T'' les nombres de témoins chez les fortement et faiblement vaccinés ; par p' et p'' les taux de vaccinés parmi eux. Ces 4 nombres sont reliés par les relations suivantes :

 

T'+T''=765

p'xT'+p''xT''=512

 

Ayant choisi p' et p'' on en déduira T' et T'' (système linéaire de 2 équations à 2 inconnues).

Par exemple, avec p'=80% et p''=40% on obtient T'=515 et T''=250. Les nombres de témoins vaccinés seront alors p'xT'=412 et p''xT''=100.

 

Pour aller plus loin il faut aussi choisir le nombre C' de cas dans le groupe des "fortement vaccinés". Le nombre C'' de cas chez les "faiblement vaccinés" s'en déduit par la relation C'+C''=101. On obtient alors les nombres moyens de témoins par cas dans chacun des 2 groupes : M'=515/C' et M''=250/C''.

 

Nous constatons que les nombres T' et T'' de témoins ne dépendent que de p' et p'' et pas du choix de C' ce qui permet de restreindre considérablement les investigations.

 

De plus, C' ne peut pas prendre toute valeur entre 0 et 101 car il doit y avoir 515 témoins associés aux C' cas et il existe une autre contrainte qui limite la plage des possibilités. En effet, en raison des nombreuses défections de témoins, seulement 22 des 143 cas ont eu entre 11 et 12 témoins, 81 entre 7 et 10, 34 entre 4 et 6 et 6 entre 1 et 3.

 

On n'a pas droit à plus de précisions !

L'étude 2008 publiée par les mêmes auteurs donne 8 cas supplémentaires de SEP avec 70 témoins associés à ces cas. Comme aucun renseignement n'est donné sur les nombres de vaccinés parmi eux, j'ai écrit à  Y. Mikaeloff, l'auteur correspondant pour cette étude,  afin d'avoir ces informations banales. Je n'ai pas reçu de réponse...Et vive la démocratie sanitaire ...

 

 La valeur minimale de C' sera obtenue en attribuant 12 témoins à chacun des 22 cas ayant de 11 à 12 témoins soit 264. Il reste 515-264=251 témoins qui demanderont au moins 26 cas puisqu'on dispose au plus de 10 témoins pour chacun d'eux. Cette valeur minimale de C' sera donc 22+26=48.

 

De même il faut pouvoir associer 250 témoins aux C'' cas. Comme 250=12x20+10 il faudra au minimum 21 cas. Aussi, la valeur maximale de C' sera 101-21=80.

 

Pour ces raisons strictement mathématiques, le nombre de cas dans le groupe des "fortement vaccinés" est donc compris entre 48 et 80 lorsque p'=80% et p''=40%.

 

Le tableau ci-dessous donne sous cette hypothèse les valeurs M' et M'' des nombres moyens de témoins par cas selon différentes valeurs de C' :

 

C'

48

54

60

64

67

68

69

72

76

M'

10,73

9,54

8,58

8,05

7,69

7,57

7,46

7,15

6,78

M''

4,72

5,32

6,1

6,76

7,35

7,58

7,81

8,62

10

 

Constat

L'écart entre M' et M'' peut être très important. Ces 2 valeurs sont égales pour C'=68. On pourrait penser qu'un écart trop important entre M' et M'' est peu crédible puisque cela demande d'admettre qu'il y aurait eu beaucoup plus de défections parmi les témoins de l'un des groupes que l'autre. Par exemple pour C'=48 on a  M'=10,73 et M''=4,72 soit en moyenne 6 témoins de moins par cas alors que l'institut CSA avait fourni pratiquement 12 témoins par cas.

 

Si on retenait ce critère on pourrait pratiquement localiser C' entre 64 et 72. 

Les investigations que j'avais conduites et reproduites en Annexe de   "Sclérose en plaque ches les enfants : des données très démonstratives" conduisent à penser que la moyenne des témoins par cas serait nettement plus faible pour le groupe "vacciné Engerix" que pour le groupe des autres vaccinés. Comme les enfants vaccinés au collège ont surtout été vaccinés avec Engerix on peut s'attendre à ce que la moyenne des témoins dans le groupe des"fortement vaccinés" soit sensiblement plus faible que dans le groupe des "faiblement vaccinés". C'est ce qui se produit ici au delà de 68 avec par exemple pour  C'=72, M'=7,15 contre M''=8,62. On a ainsi une indication que le nombre C' pourrait être très élevé,  dépassant 68 plutôt qu'allant vers 64.

Il y a eu 4 classes d'âge vaccinées en sixième alors que de 1994 à 2003, 10 classes d'âge ayant au moins 10 ans au cours de cette période ont pu être suivies. Je pense qu'on peut estimer à au plus 45% le poids de ces 4 classes d'âge parmi elles. Le nombre attendu de SEP serait donc au plus 45% de 101 soit 45,5. 64 cas, à plus forte raison davantage, créerait une différence très significative qu'il faudrait expliquer. Le statut vaccinal des cas n'est pas pris en compte ici.

 

Prendre en compte le statut vaccinal

Pour  tester avec le statut vaccinal des cas pour ces 2 groupes il faut attribuer une valeur V' au nombre de cas vaccinés parmi les C' cas. On aura V'+V''=70 où V'' désigne le nombre de vaccinés parmi les C'' cas du groupe des "faiblement vaccinés". Il devient alors possible de calculer les odds ratio OR' et OR'' pour ces 2 groupes ainsi que les probabilités tests correspondantes.

 

Comme la partition en 2 groupes fait perdre de la puissance statistique on peut la récupérer en procédant ainsi (uniquement si c'est utile c'est à dire si les 2 tests vont dans le même sens) :

Au lieu de cumuler les données comme le font les auteurs on effectue le produit OR'xOR'' auquel on peut facilement attribuer une loi de probabilité. En effet, les logarithmes (népérien) de OR' et OR'' suivent à peu près des lois normales de moyennes 0 et de variances estimées à partir des données. Comme elle sont indépendantes leur somme suivra à peu près une loi normale de moyenne 0 et ayant pour variance la somme des variances des 2 composantes. Ainsi il n'y a aucune perte de fiabilité : la fiabilité du test sur le produit OR'xOR'' sera la même que sur OR' et OR'' ce qui n'est pas le cas si on cumule les données.

 

Toujours avec p'=80% et p''=40% voici quelques résultats où les valeurs significatives sont en rouge (rouge foncé pour les tests significatifs côté vaccin ''protecteur'') :

 

C'

48

54

60

64

67

68

69

72

76

V'

44

50

55

58

61

62

63

65

69

OR'

valeur test

2,75

2,90%

3,13

1,60%

2,75

1,75%

2,42

2,31%

2,54

1,74%

2,58

1,58%

2,63

1,44%

2,32

2,07%

2,46

1,42%

OR''

valeur test

1,44

11,30%

1,11

37%

0,87

66,07%

0,72

81%

0,54

93,38%

0,48

95,75%

0,42

97,39%

0,3125

98,90%

0,0625

99,65%

Valeur test

OR'xOR''

1,23%

2,25%

7,20%

 

16,67%

29,96%

36,30%

43,82%

68,80%

95,43%

 

Observons la dernière ligne :

1- De C'=48 à C'=76 la probabilité test s'étale de près de 1% à plus de 95% alors que le test sur les données cumulées qui ne tient pas compte des valeurs prises par C' et V' donne 31,6%.

2- Le test sur OR'xOR'' donne des résultats proches du test sur les données cumulées quand C' est égale à 67-68 c'est à dire quand M' et M'' sont très proches.

 

Ce n'est pas le hasard : dans une telle situation avec des couvertures vaccinales très différentes entre 2 groupes il est nécessaire que les nombres moyens de témoins par cas soient les mêmes pour les 2 groupes. C'est ce qu'on illustre ici et une démonstration théorique est proposée en annexe.

 

En conséquence on constate qu'il n'est pas légitime de tester sur les données cumulées sans s'assurer que cette condition est satisfaite, ce que les auteurs de l'étude n'ont pas fait.

 

Ils ne sont pas responsables de l'énorme dispersion des témoins mais ils pouvaient rétablir la situation de 2 façons :

1- Effectuer un tirage au sort pour ramener le nombre de témoins à au plus 6 ou même 5 afin de réduire la dispersion. C'est ce qu'ils ont fait dans l'étude publiée en 2008 pour le groupe des observants au calendrier vaccinal pour lequel le nombre moyen de témoins par cas est 4,82. C'est ce groupe qui contient le fameux groupe significatif et c'est peut-être en partie pour cette raison.

2- Procéder comme je le fais en traitant séparément les 2 groupes puis en testant sur le produit de leurs odds ratio.

 

Les auteurs de l'étude sont responsables de n'avoir utilisé aucune de ces 2 méthodes mais ils ne le sont pas individuellement : cette attitude semble commune à toute l'épidémiologie.

 

 

Vaccinés au collège : un groupe significatif ?

Peut-on envisager que l'un des 2 groupes définis ici, celui des "fortement vaccinés" ou celui des "faiblement vaccinés" serait significatif ? Les tests que j'ai présenté dans le tableau en laissent la possibilité.

Si on accepte qu'il est vraisemblable que l'écart entre les nombres moyens M' et M'' de témoins entre les 2 groupes ne devrait pas être trop important, le nombre C' de cas devrait être au moins égal à 64*. Le groupe des ''fortement vaccinés'' correspond à 4 classes d'âge alors que le suivi portait sur 10 années, ce qui permet de suivre plus de 10 classes d'âge entre 10 et 16 ans pendant cette période Aussi, la proportion des ''fortement vaccinés'' parmi les 10-16 ans ne devrait pas dépasser 45%. En nombre de cas, 64 sur 101 créerait donc un écart largement significatif par rapport aux tailles des groupes.

 

Mais il faut aussi tenir compte du nombre V' de vaccinés parmi eux. Il devra dépasser largement 80% soit 51 cas pour que le test sur OR' soit significatif. Avec 64 il en faut au moins 58. Il en reste alors seulement 12 pour l'autre groupe qui aura un odds ratio faible et même largement inférieur à 1 (OR''=0,71).

On fait alors un constat intéressant : pour que OR' soit significatif il faut pratiquement que OR'' soit faible et même inférieur à 1*. Autrement dit, il faut déshabiller Pierre pour pouvoir habiller Paul. Le tableau montre que ce n'est pas obligatoire, du moins pour obtenir un test significatif sur le produit des odds ratio, mais seulement pour des valeurs faibles de C' comme 54 ou 48 qui impliquent des écarts considérables et peu crédibles entre M' et M''.

 

* Si on devait avoir plus de 68 cas chez les "fortement vaccinés" comme on peut maintenant l'envisager, il faut aussi envisager, comme le montre le tableau, que le groupe des "faiblement vaccinés" puisse être significatif côté vaccin "protecteur".

 

La question se pose alors : le vaccin aurait-il pu être dangereux pour un groupe et avoir un effet statistique ''protecteur'' pour l'autre ? Cela paraît paradoxal sauf à admettre que le groupe des ''faiblement vaccinés'' aurait un déficit de cas. Il y a au moins 2 raisons pour cela :

1- 21 cas ont été exclus en raison d'une incertitude sur leur statut vaccinal. Cependant, l'âge de leur première atteinte démyélinisante est connu ce qui permet de les classer en moins de 10 ans ou 10-16 ans. Parmi ceux-ci on doit pouvoir savoir s'ils étaient en classe de sixième au moment de la grande campagne de vaccination. La répartition  de ces 21 cas donnerait une indication non négligeable. De plus, 8 cas supplémentaires de SEP ont été ajoutés aux 143 dans la publication du 8 octobre 2008. Leur statut vaccinal est donc connu.

2- Le groupe des "faiblement vaccinés" contient les cas apparus chez des enfants vaccinés à 14-16 ans et qui ont eu peu de temps pour manifester leur SEP dans les délais impartis par les conditions de l'étude, contrairement à ceux vaccinés à 11 ans en sixième. Un tel déficit est d'ailleurs suggéré par les délais d'apparition des cas après vaccination :

 

Apparition des cas en fonction du délai après vaccination

 

 

Durée

0-1 an

1-2 ans

2-3 ans

3-4 ans

Total

4-5 ans

5-6 ans

Total

>6 ans

Cas

14

14

18

16

62

9

3

74

6

Moyenne

 

 

 

 

15,5

 

 

12,33

 

 

Il y a eu 74 cas cumulés au cours des 6 années qui suivaient la vaccination. En regroupant les 4 premières années, soit 62 cas donnant une moyenne annuelle de 15,5 cas, on obtient une estimation de la moyenne de la loi de Poisson modélisant le nombre annuel de cas sur ces 4 années. Il y aura alors 5,5% de chances de ne pas dépasser 9 et surtout 0,014% de chances d'en avoir au plus 3 en testant par cette loi de Poisson (très significatif).L'anomalie est donc flagrante avec ce test portant uniquement sur les cas vaccinés : il n'utilise ni les témoins ni les taux de vaccination.

 

Interprétation

On peut proposer 2 interprétations pouvant ajouter leurs effets : des cas seraient provoqués par le vaccin, ce qui augmenterait la moyenne pendant les 4 années qui suivent la vaccination; des cas non enregistrés au delà de ces 4 années en raison des limites de la fenêtre d'observation -l'âge de 16 ans et l'année 2003- créeraient un déficit accentué par l'allongement du délai.

En conséquence le paradoxe pourrait trouver son explication.

Tout cela avive le désir de savoir ce qu'il en est réellement au niveau des données de l'étude qui sont inaccessibles. Cela confirme aussi que les auteurs n'ont pas vraiment "travaillé" les données pour en faire sortir ce qu'elles pouvaient contenir. Il faut reconnaitre qu'il est difficile de comprendre qu'ils n'aient même pas envisagé d'étudier le groupe des enfants vaccinés dans les collèges alors que ce groupe, très facile à définir, a défrayé la chronique et qu'on a beaucoup reproché aux auteurs de multiplier les  sous-groupes. C'est presque suspect.

 

 

                      Annexe

 

Voici une démonstration théorique des 2 conditions de validité des tests qui ont été rappelées dans cet article.

 

D'un point de vue théorique et sous certaines conditions le testpar l'odds ratio pourrait d'abord être présenté et  remplacé par le test de comparaison de 2 lois binomiales. En effet, si X désigne la variable aléatoire donnant le nombre de cas vaccinés parmi n cas, X suivra la loi binomiale B(n; p) où p est la probabilité pour un cas d'être vacciné mais sous la condition que cette probabilité soit la même pour les n cas considérés (et aussi que la vaccination d'un cas soit indépendante de celle des autres).

Ayant associé n' témoins à ces n cas, la variable aléatoire X' donnant le nombre de témoins vaccinés suivra, sous les mêmes conditions, la loi binomiale B(n'; p') où p' désigne la probabilité pour un témoin d'être vacciné. Le test consiste à décider si on peut accepter p=p' c'est à dire si la probabilité d'être vacciné est la même pour un cas et un témoin.  Il s'agit d'un test très classique.

Pour tester on forme la variable aléatoire X/n-X'/n' qui suit la loi normale de moyenne p-p' et dont on sait estimer la variance. L'hypothèse p=p' se traduit par une moyenne nulle pour cette variable aléatoire ce qui élimine la nécessité d'attribuer une valeur particulière à p, du moins pour évaluer la moyenne théorique.

 

Une première condition apparaît clairement ici :

Chaque cas doit  avoir la même probabilité d'être vacciné. Si elle n'est pas satisfaite il faut réaliser une partition des cas pour l'obtenir sur chaque partie.

 

Ayant donc un second groupe avec son nombre Y de cas vaccinés qui suit la loi binomiale B(m; q) et le nombre Y' de témoins vaccinés de loi binomiale B(m'; q') on teste de la même façon l'hypothèse q=q' c'est à dire q-q'=0.

Pour récupérer la puissance statistique perdue en partageant ainsi en 2 groupes on peut souhaiter pouvoir ajouter les deux lois de probabilités utilisées pour tester. La moyenne de leur somme sera la somme des 2 moyennes c'est à dire 0. Cela correspond au test sur OR'xOR''.

 

Si on veut tester sur les données cumulées des 2 groupes, ce qui n'est nullement indispensable, la variable aléatoire X+Y donnera le nombre de cas vaccinés et X'+Y' le nombre de témoins vaccinés. X+Y suivra une loi normale de moyenne np+mq alors que X'+Y' suivra une loi normale de moyenne n'p'+m'q'=n'p+m'q sous l'hypothèse p=p' et q=q' qui est celle qu'on veut tester.

On procède alors de la même façon en considérant la variable aléatoire

      (X+Y)/(n+m)-(X'+Y')/(n'+m')

Elle aura pour moyenne (np+mq)/(n+m)-(n'p+m'q)/(n'+m') car X a pour moyenne np etc.

Pour pouvoir tester il faut que cette moyenne soit nulle afin de ne pas avoir une valeur particulière inconnue à lui attribuer. Cette condition impérative se traduit par

     (n'+m')(np+mq)=(n+m)(n'p+m'q)

En développant et simplifiant on trouve nm'(p-q)=mn'(p-q). Condition qui exige soit p=q soit nm'=mn'.

 Comme on est dans la situation où p est différent de q on doit avoir n'/n=m'/m qui  donne la seconde condition :

      le nombre moyen de témoins par cas doit être le même dans les 2 groupes.

Bien entendu, il ne faut pas s'imaginer  que les 2 conditions qui apparaissent ici très clairement vont s'évanouircomme par enchantement quand on remplace le test par la loi binomiale par le test avec l'odds ratio.

Conclusion

1- Quand la couverture vaccinale n'est pas suffisamment homogène dans la population on cherchera à réaliser une partition de celle-ci en strates à peu près homogènes du point de vue de la couverture vaccinale.

2- Si on veut tester sur les données cumulées (non indispensable), le nombre moyen de témoins par cas devra être le même dans chaque strate. Si on ne teste pas sur les données cumulées mais sur les données pour chaque groupe on peut tester en faisant ensuite, le cas échéant, le produit des odds ratio. Cela n'aura d'intérêt que pour les groupes dont les tests vont dans le même sens.

Mais les épidémiologistes ne voudront pas procéder ainsi car ils perdraient l'interprétation de l'odds ratio en risque relatif. Or c'est cela qui fait la fortune de l'épidémiologie : tous les jours on nous annonce une nouvelle étude nous disant que si on fait ceci on aura 2 fois plus de risque pour qu'il nous arrive cela. Chacun croit comprendre même si, quand le risque passe de 1 sur 2 milliards à 1 sur1 milliard ça ne change pas grand chose mais ce 2 fois plus est parlant et suggestif. Les médias adorent et font une énorme pub à ce genre d'études. Tant pis pour la rigueur...

 

 

[1] http://archpedi.ama-assn.org/cgi/content/full/161/12/1176

[2] http://www.ncbi.nlm.nih.gov/pubmed/18843097

[3] Voici un lien vers un diaporama qui commente (sans aucun esprit critique) l'étude 2008 :

http://dpt-medecine-generale.medecine.univ-paris5.fr/IMG/pdf/tude_Mikaeloff_SEP_vacHBV.pdf