Derniers articles sur l'affaire de la vaccination hépatite B

18 mars 2011 : "Sclérose en plaques chez les enfants : des données très démonstratives" une nouvelle analyse des données des études 2007-2008 Mikaeloff-Tardieu. L'article ci-dessous étudiait les critiques des Comités d'experts sur cette étude mais pas l'étude elle-même.

 

8 février 2009 :Hépatite B : 50% des nourrissons vaccinés ne seraient pas protégés 15 ans après ?

15 octobre 2008 : Hépatite B : défense de l'étude du professeur Tardieu

 

10 octobre 2008 : L'affaire de l'Engerix B : un non-événement pour notre Haut conseil de santé publique

 

2 octobre 2008 :

Vaccin Engerix B : le quart de la commission de pharmacovigilance ne soutient pas  ses conclusions

 

26 septembre 2008 Vaccin hépatite B et sclérose en plaques : il n'y a pas que les enfants

 

 

Une fois passé l'orage médiatique, l'étude du professeur MarcTardieu qui suggérait une interaction entre la vaccination hépatite B et les autres vaccinations dans l'apparition de scléroses en plaques chez les enfants a été critiquée par la  Commission de pharmacovigilance. Sévèrement avec des arguments justes et posés ou avec des arguments médiocres ? Nous allons voir qu'il y a beaucoup de parti-pris  dans ces critiques et qu'elles ne sont pas dépourvues d'un effet boomerang qui pourrait frapper leurs auteurs...Le seul problème est que c'est un peu technique et que le caractère inadapté de certaines critiques n'est pas toujours facile à saisir.  Alors tentons d'expliquer, même de façon imagée, comme cet article va s'efforcer de  le faire.

 

Note : le professeur MarcTardieu est certainement parfaitement capable de défendre seul son étude mais je doute fort que ses contre-critiques soient rendues publiques. C'est pourquoi j'ai décidé d'y participer !

Surtout que, selon un article de Libération, "Ce risque que je ne saurais voir", il aurait été interdit de conférence de presse !

 

Additif : 

Je ne croyais pas si bien dire puisque, quelques heures après avoir publié ce texte j'apprends que Yahoo! venait de mettre en ligne un article [la page a été supprimée] où on lit que le professeur Jean-François Bach, secrétaire perpétuel de l'Académie des Sciences, s'en prend à l'étude du professeur Tardieu en  soulignant " l'énorme erreur statistique" commise par ce professeur et son équipe, affirmant " qu'on ne peut pas analyser des sous-groupes comme des groupes entiers et que le dossier est vide". C'est vraiment un tir de barrage complet si l'Académie des Sciences s'y met aussi !!!

 

 

 

Le secrétaire perpétuel de l'Académie des Sciences pourrait être un physicien, un chimiste ou un astronome par exemple. On pourrait alors s'étonner de son intervention sur cette affaire. On est beaucoup moins surpris quand on apprend que Jean-François Bach est un immunologiste (biologiste) au CHU Necker de Paris et qu'il a été expert auditionné au cours de l'audition publique sur la vaccination hépatite B le 9 novembre 2004. A propos de ses liens d'intérêts avec l'industrie il avait déclaré des interventions ponctuelles.

Dans une déclaration à Destination Santé (18/11/2004) il avait manifesté son désaccord avec les critiques contre la vaccination hépatite B. Dans ces conditions, on comprend mieux les motivations de son intervention. Il aurait cependant pu la faire en tant qu'immunologiste plutôt que secrétaire perpétuel de l'Académie des Sciences car enfin, était-il mandaté par ses collègues pour une telle intervention ?  Autrement dit, a-t-il parlé au nom de l'Académie et de la Science ou en son nom propre ?

 

Nouvel additif !

Le journal Le Monde publie le 29 octobre un article sur le sujet où il présente un encart :

 

« le professeur Tardieu avait prévu de présenter à la presse cette étude le 8 octobre. Moins d'une heure avant l'horaire prévu, ce point presse a été reporté sine die. Interrogé, le service de communication de l'hôpital n'a pas donné de précision sur les raisons du report, indiquant simplement qu'une nouvelle date serait fixée. Le ministère de la santé aurait fait valoir un téléscopage d'horaire avec la publication de l'avis du Haut Conseil de la santé publique. A ce jour, le point presse du professeur Tardieu ne s'est toujours pas tenu. »

 

Encore un additif !

Au colloque "Les vaccins: une excellence française à préserver"  organisé par des parlementaires à la Maison de la Chimie à Paris le 4 mars 2009, le sénateur Paul Blanc a dit que Marc Tardieu devait être présent à ce colloque mais il n'est pas venu...Aucune explication n'a été donnée sur les raisons de son absence.


Il existe une publication sous forme d'une lettre croustillante du pharmacologue Bernard Bégaud de Bordeaux qui, bien que datant de 1991, est parfaitement d'actualité. J'invite le lecteur à aller la lire ([3] page 139). Voici de brefs extraits :

 

1-Tout se gâte quand un produit est mis sur la sellette.

2- Un résultat défavorable ne peut avoir qu'une seule explication : l'étude est volontairement ou involontairement biaisée.

3- L'étude paraît-elle présenter des biais évidents ?  Si la réponse est non (ce qui est le plus probable si l'étude a été faite par de bons épidémiologistes et publiée dans un bon journal), on peut se poser une question en permanence escamotée : le résultat de l'étude étant considéré comme non biaisé, comment peut-on l'expliquer ?

Toute cette affaire illustre parfaitement les propos vigoureux d'un connaisseur...qui fut vice-président de la Commission nationale de pharmacovigilance. 

Les critiques exprimées par la Commission de pharmacovigilance, telles que formulées dans le compte rendu du 30/09/2008 ont été développées en 6 points [1]. L'essentiel de ces critiques s'est focalisé sur le fait d'aller chercher des sous-groupes au sein du groupe initial qui avait été constitué. La Commission revient constamment sur ces découpages, comme une véritable obsession, s'interrogeant sur leur justification et les biais qu'ils pourraient engendrer alors que ce serait plutôt le fait de traiter globalement le problème qui serait critiquable.

 

 

L'exemple de l'industrie du vêtement

La taille moyenne de la population globale n'a aucun intérêt pour elle, il lui importe au contraire de partager la population en plusieurs sous-groupes au sein desquels les tailles et corpulences seront suffisamment proches pour pouvoir habiller toutes les personnes du même sous-groupe avec le même vêtement. On voit ainsi de façon simple et parlante que la dispersion par rapport à la moyenne -ce qu'on mesure par l'écart-type- joue un rôle tout à fait fondamental : si cette dispersion est trop importante il faudra scinder en plusieurs sous-groupes jusqu'à obtenir des dispersions assez faibles par rapport aux moyennes pour chacun de ces sous-groupes.

Récemment, une grande enquête avait été réalisée en France pendant près d'une année pour redéfinir les nouvelles tailles.

 

Le cas d'un référendum

A contrario,c'est le résultat global moyen que tout le monde attend et qui fera la décision. Mais pour pouvoir annoncer le bon résultat à 20 h les soirs d'élections les instituts de sondage doivent réaliser un partage de la population en sous-groupes où les votes seront à peu près homogènes et connaître la proportion de chaque sous-groupe dans l'ensemble. Puis il devront définir pour chacun de ces sous-groupes un échantillon représentatif qui sera sondé.

Autrement dit, pour estimer valablement le résultat global les instituts de sondage commencent par réaliser une étude de sous-groupes alors que nos épidémiologistes font l'inverse : ils recherchent d'abord le résultat moyen global pour  s'intéresser ensuite, à l'occasion, à des sous-groupes.

C'est une très mauvaise méthodes. Si on leur confiait les sondages électoraux il y aurait une bonne chance pour qu'on rigole à minuit quand le résultat définitif sera confronté aux annonces qu'ils auront faites à 20 heures...Et si l'industrie du vêtement leur confiait le soin de définir les tailles et corpulences moyennes pour la confection des vêtements on verrait les grands, les gros, les petits et les menus aller tout nus dans les rues pendant que des tonnes de vêtements invendus encombreraient les commerces...

 

L'étude du professeur Tardieu

Cette étude a été menée sur une cohorte d'enfants âgés d'au plus 16 ans chez lesquels un épisode démyélinisant aigu du système nerveux central avait été diagnostiqué entre 1994 et 2003, soit sur une période de 10 ans. Une cohorte est par définition un groupe de personnes suivies pendant une certaine durée. Cette cohorte, dénommée KIDSEP, comportait  403 cas dont 349 avaient accepté de participer à l'étude et disposaient de leur carnet de vaccination. Les dates des vaccinations étaient comparées à la date du premier épisode de démyélinisation. Ces  349 cas ont été associés à 2941 témoins, c'est à dire qu'à chacun d'eux était associé, par tirage au sort dans la population, un certain nombre d'enfants indemnes d'affections démyélinisantes, du même âge (à 6 mois près), de même sexe et de même localisation géographique.

 

Le principe de l'étude consiste alors à comparer le nombre de vaccinés parmi les cas et parmi les témoins. Si les vaccinés sont significativement plus nombreux chez les cas que chez les témoins on pourra alors penser qu'il existe une cause autre qu'aléatoire à cela et qu'il faut la rechercher. La vaccination est alors la première cause suspectée mais il peut y en avoir d'autres. Par principe, de telles études ne peuvent avoir au départ l'ambition de démontrer formellement la responsabilité du vaccin ou de l'innocenter, mais  d'orienter les recherches.

 

Rappelons que l'étude mettait en évidence un sur-risque important de sclérose en plaques (SEP) évalué à 2,77 chez les enfants à la fois vaccinés par l'Engerix B et ayant respecté le calendrier vaccinal* alors que ceux qui avaient été moins vaccinés en dehors de l'hépatite B étaient moins frappés par cette maladie. Voir à ce sujet  " l'affaire de l'Engerix B : un non-événement pour notre Haut conseil de santé publique ! " ([2])

*Par respect du calendrier vaccinal il faut entendre ici, selon la définition donnée dans l'étude, le fait pour un enfant d'avoir reçu le BCG, une dose de ROR et 4 doses de DTP avant l'âge de 2 ans.

 

Reprenons maintenant les différents points de la critique pour se demander plus en détail ce qu'ils valent.

 

Critique n° 1

 

« Compte tenu de l’ensemble des analyses de sous-groupes réalisées, et donc de la multiplicité des tests qui ont été effectués (environ 160), il existe une augmentation très importante du risque de première espèce, et la probabilité de détecter une association significative par le simple fait du hasard est donc très élevée. Ce problème de multiplicité des tests est d'autant plus préoccupant que ces analyses ont été réalisées sans que les résultats principaux soient significatifs et sans test d'interaction.

Il est également à noter que les résultats concernant la SEP publiés en 2007 sur l'ensemble de la population (sans restriction aux seuls observants vis-à-vis du calendrier vaccinal) ne montraient pas d'association avec la vaccination. »

 

Transposons cette multiplicité des tests sur l'expérience suivante : on demande à un millier de personne de lancer une pièce et de donner le résultat, pile ou face. Chacun choisit sa pièce, aussi les uns prennent une pièce de 1 euro, d'autres de 2 euros ou d'un franc, voire d'anciens francs, d'autres vont même chercher un napoléon en or ou des pièces trouées d'après guerre... Globalement, avec 505 piles et 495 faces rien n'indique un quelconque déséquilibre. Mais compte tenu de la grande variété des pièces utilisées il est légitime et nécessaire de regarder par sous-groupes les différents résultats. On constate alors que chez les 30 personnes qui ont lancé un napoléon il y a eu 25 piles, ce qui est très significatif d'un déséquilibre de cette pièce. On a là un résultat très intéressant. Soutenir que le résultat global serait le seul vraiment important sous prétexte qu'il regroupe l'ensemble des pièces est une absurdité totale : c'est au contraire le fait de regrouper les résultats obtenus avec des napoléons en or,  des pièces trouées et des euros en alliages modernes qui pourrait être considéré comme une méthodologie douteuse.

 

Un exemple : pour le référendum de Maastricht le oui l'avait emporté avec juste 51% des voix. Mais dans les zones rurales et petites villes c'était le non qui l'emportait avec 51%. Il y avait donc 2 sous-groupes importants  avec des résultats assez proches en termes de pourcentages mais opposés en terme de décision. Si les sondeurs s'étaient basés sur les résultats des bureaux de votes qui ferment à 18h pour annoncer à 20h le résultat définitif,  ils auraient annoncé la victoire du non !

 

Une anecdote : le soir de ce scrutin, à 22h, le ministère de l'Intérieur communique les résultats en sa possession. Ce n'est pas un sondage mais les résultats cumulés des bureaux de vote ayant fermé à 18h. Le non est en tête et Madame Simone Weil est présente sur un plateau télé avec le directeur d'un institut de sondage. Devant ces résultats elle blêmit : "c'est complètement surréaliste, dit-elle, nous discutons sur la victoire du oui et c'est le non qui est en train de l'emporter  ! " Le directeur de l'institut tente de la rassurer, " nous sommes sûrs de nos résultats" dit-il et explique le problème, un tantinet amusé par la réaction...   

 

Risque de première espèce

Dans la critique  de la Commission il en est question, mais ça veut dire quoi ? Si l'expérience consiste à lancer 100 fois une pièce pour tester un éventuel déséquilibre et si le niveau fixé pour le test est de 5% on coure un risque de 5% pour que le hasard produise un nombre de piles suffisamment éloigné de 50 pour rejeter l'hypothèse que la pièce est équilibrée alors qu'en réalité elle l'est. Ce risque de rejeter une hypothèse vraie est nommé risque de première espèce, il est égal au niveau du test. Ainsi, si on recommence 100 fois l'expérience, c'est à dire ici si on fait 100 séries de 100 jets chacune avec une pièce équilibrée, on refusera en moyenne 5 fois que la pièce est équilibrée. C'est ce que veut dire cette critique : en multipliant les tests le hasard finira par donner un résultat jugé significatif d'un déséquilibre.

 

Mais est-ce applicable dans notre situation ?

 

Non, car il y a au moins 2 raisons à cela :

1- Il ne s'agit pas du même type de multiplicité que dans la définition du risque de première espèce. Pour le comprendre il suffit de penser à l'expérience avec des pièces de diverses natures : lancer 30 napoléons, 150 pièces de 1 euros, 200 pièces de 2 euros etc n'est pas en soi assimilable avec l'expérience qui consiste à faire une série de 30, puis une série de 150, puis une autre série de 200 jets avec le même type de pièce. Ce n'est pas uniquement, ni essentiellement, parce que les séries n'ont pas les mêmes tailles, mais surtout parce que les pièces ont des caractéristiques physiques différentes : un napoléon pourrait être déséquilibré au profit de pile par exemple et pas une pièce de 1 euro. Il y a donc là une confusion majeure de la part de nos experts de la Commission de pharmacovigilance.

 

Il y a une importante différence entre lancer toujours la même pièce et lancer des pièces de types différents : dans le premier cas la probabilité de tomber sur pile sera toujours la même et si la pièce est déséquilibrée on finira par s'en apercevoir. Par contre, en lançant le même nombre de fois une pièce ayant 60% de chances de tomber sur pile et une autre ayant 40% de chances on pourrait ne pas voir le problème.

 

2 - Les différentes expériences doivent être indépendantes. C'est à dire que les résultats des unes n'influencent pas ceux des autres. Or, il est fort douteux qu'en formant 160 sous-groupes avec 349 enfants en utilisant de multiples critères on ait 160 sous-groupes indépendants. Comme les tests sont faits au niveau 5%, si ces 160 sous-groupes étaient indépendants ils auraient dû obtenir en moyenne 7 ou 8 résultats significatifs, la moitié dans un sens, l'autre moitié dans l'autre. Comme ce n'est semble-t-il pas le cas on est fondé à conclure à une très forte absence d'indépendance. D'ailleurs certains sous-groupes sont emboités  ce qui exclut toute possibilité d'indépendance entre eux pour le risque de sclérose en plaques.

Pour enfoncer le clou

Pour expliciter avec le problème des vaccinations on peut avoir des enfants qui ont eu le BCG à la naissance et le vaccin hexavalent à l'âge de 2 mois, des enfants qui n'auront pas eu le BCG mais l'hexavalent à 2 mois, ceux qui auront ni le BCG ni l'hexavalent mais le tétracoq puis le vaccin hépatite B plus tard etc. Toutes ces situations peuvent créer des états biologiques très différents et ne peuvent en aucun cas être considérées comme la répétition d'une même expérience pouvant créer un  risque de première espèce de trouver par le fait du hasard une expérience significative.

 

Le regroupement des expériences : reprenons nos 100 séries de 100 jets avec une même pièce. Elles pourraient donner en moyenne 5 séries significatives (à 5%) que la pièce soit déséquilibrée. Mais en pareil cas il n'y a aucune difficulté à regrouper les 100 séries pour considérer qu'on a en fait lancer 10 000 fois la pièce. Dans ces conditions on dispose d'un moyen beaucoup plus puissant pour décider si la pièce est ou non déséquilibrée.

Supposons, pour simplifier, que sur les 100 séries de 100 jets, 95 aient donné 50 piles, deux  40 piles et trois 60 piles, soit 5 séries significatives d'un déséquilibre. En totalisant on obtient 5010 piles sur 10000 jets, ce qui n'indique aucun déséquilibre bien évidemment.

Supposons maintenant que les 100 séries aient donné chacune 54 piles.  Ces expériences prises séparément ne permettent pas de mettre en évidence le moindre déséquilibre, mais en les regroupant on obtient 5400 piles contre 5000 attendus en moyenne et là on peut pratiquement conclure à l'existence d'une anomalie (un déséquilibre ou une expérience mal conduite).

Chacun comprendra alors facilement que si on fait l'expérience avec 100 pièces toutes différentes et que seul le napoléon est déséquilibré et donne 100 piles en 100 jets, cet écart énorme pourrait être masqué en cumulant avec les résultats des autres pièces.

 

Il est donc fondamental -et non pas pathologique comme l'ensemble des déclarations au sujet des sous-groupes considérés par le professeur Tardieu voudraient nous le faire croire- de dissocier des situations différentes et non pas de les regrouper.


De façon suggestive, on pourrait résumer l'affaire ainsi : un expert lance 100 fois un napoléon et obtient 80 piles; puis il lance 100 fois une pièce trouée et obtient 80 faces. En cumulant les 2 expériences il annonce qu'ayant lancé 200 fois une pièce il a obtenu exactement 100 piles et 100 faces et s'en va  en sifflotant "Tout va bien Madame la Marquise..." Que quelqu'un s'avise de dissocier les 2 expériences et  voilà qu'il s'indigne et parle d'incompétence !

 

D'autres critiques vont  reprendre le même problème sous d'autres formes.

 

La notion de groupe entier ou de sous-groupe est totalement subjective : à la cohorte KIDSEP française on peut adjoindre des cohortes équivalentes prises dans les autres pays européens par exemple et faire apparaître la cohorte française comme un sous-groupe de sous-groupe...autant de  fois qu'on voudra en retirant par exemple un à un les autres pays européens.

Le problème fondamental est simple : disposant d'un échantillon de personnes on se demande si on peut le considérer comme un échantillon représentatif d'une population plus importante, puis on cherche à préciser avec quelle sécurité il sera possible d'appliquer à cette population les observations faites sur l'échantillon. Ces histoires de groupe entier et de sous-groupe sont à dormir debout, n'importe quel groupe dit entier étant le sous-groupe d'une multitudes d'autres groupes, emboités ou non. En feraient-ils autant si la conclusion avait été favorable aux vaccins ?

 

 

Dans le raisonnement de nos experts il y a une faille fondamentale car sinon il permettrait de déclarer fortuit tout résultat significatif en le noyant dans un nombre suffisant d'expériences non significatives et donc d'anéantir la démarche statistique...

Quand on dit  "je fais l'hypothèse que la pièce est équilibrée" on fait en réalité 2 hypothèses qu'il faut dissocier. La première est que toutes les pièces ont la même probabilité de tomber sur pile et c'est ce qui va permettre la modélisation mathématique (avec en plus l'indépendance des jets). La seconde consiste à fixer la valeur de cette probabilité. Si on utilise la même pièce la première condition est satisfaite. Par contre, si elles sont de types différents cela devient une supposition. Si une expérience vient suggérer que cette supposition pourrait être fausse on ne peut s'appuyer sur une supposition pour écarter un fait.

De même, rien ne permet d'affirmer que les enfants des 160 sous-groupes considérés par M.Tardieu avaient tous la même probabilité que leurs témoins sans SEP d'avoir été vaccinés. C'est justement ce qu'on cherche à tester. Le recours au risque de première espèce ne peut se faire que sous cette condition. C'est pourquoi, ne sachant si elle est satisfaite, on ne peut l'utiliser pour  écarter les observations allant à son encontre. Cela s'appellerait admettre ce qu'il faudrait démontrer.

 


 

 

Niveau choisi et niveau réel du test

On peut décider a priori de tester  à 5% mais le niveau réel du test va dépendre du résultat obtenu. Pour le comprendre testons à 5% si une pièce est équilibrée en la lançant 100 fois. La zone d'acceptation sera entre 41 et 59 piles et la zone de refus sera en dehors. Autrement dit, si on obtient au plus 40 piles ou au moins 60 on décidera de refuser l'hypothèse que la pièce est équilibrée. On a ainsi à peu près 5 chances sur 100 de rejeter l'hypothèse quand la pièce est équilibrée. Supposons qu'on obtienne 70 piles. On a une chance sur 25000 d'avoir au moins 70 piles quand la pièce est équilibrée. En pareil cas on ne peut pas se contenter de dire qu'on a refusé l'hypothèse au seuil 5%. On a beaucoup plus.

 

Pour appliquer cela à notre affaire de vaccin hépatite B il faudrait calculer la probabilité d'obtenir, sous le seul effet du hasard, un écart au moins aussi grand que celui qui  a été observé. Pour cela il faut disposer des valeurs absolues observées et pas seulement des valeurs relatives qui sont souvent, malheureusement, les seules couramment publiées. Néanmoins, en utilisant  les intervalles de confiances proposés et leur formule de calcul il est possible de dire que cette probabilité (relativement au 2,77) est de façon certaine inférieure à 1%, ce qui affaiblit d'autant le risque de première espèce évoqué pour expliquer le caractère fortuit du résultat constaté et qui était évalué à 5%.

 

Critique n°2

 

« La justification de l’analyse restreinte aux enfants observants au calendrier vaccinal officiel n’apparaît pas claire.

Elle semble reposer sur l’hypothèse d'un possible biais de réponse des témoins, en faveur d'enfants globalement mieux vaccinés que la population générale, ce qui aurait pu entrainer une sous-estimation de l’OR (risque relatif).

Il est surprenant que l'hypothèse de ce biais ait été maintenue au vu des résultats donnés par les auteurs sur l'absence de différence de taux d’observance aux recommandations entre les cas et les témoins.

Par ailleurs, l’analyse dans le sous-groupe des enfants non observants au calendrier vaccinal, aurait probablement montré un effet « protecteur » du vaccin.

 

Aussi, il aurait été souhaitable de compléter l'analyse en introduisant la variable  « observance » dans le modèle d'analyse multivariée afin de pouvoir discuter de l'influence du statut vaccinal global de l'enfant sur la relation entre le statut vaccinal spécifique contre l'hépatite B et le risque de SEP. »

 

Mais pourquoi faudrait-il justifier a priori le choix de ce sous-groupe ? C'est comme s'il fallait une justification particulière pour regarder les résultats obtenus avec uniquement les pièces trouées ou les napoléons ! C'est naturel car les différences physiques entre les pièces sont évidentes et la justification se fait a posteriori quand on met en évidence, par exemple, que les napoléons sont déséquilibrés au profit de pile. Il est légitime de se poser la question d'une interaction possible entre le vaccin hépatite B et les autres : un enfant qui a reçu de nombreux vaccins n'est pas dans le même état biologique que celui qui n'en a pas eu, ou beaucoup moins. Aussi, la réaction de l'organisme à la vaccination hépatite B pourrait être différente et c'est ce que l'étude laisse supposer. Il y a donc là un élément très intéressant. Trop peut-être et c'est sans doute ce qui a provoqué cette levée de boucliers mais avec des arguments pas forcément très valides comme on le constate ici.


Témoins : un biais de sélection avantageux pour le vaccin ?

La Commission de pharmacovigilance parle aussi, pour l'ensemble des cas et sur moins de 3 ans après la vaccination, "d'une protection presque significative " pour les vaccinés vis à vis de la maladie étudiée (critique 5) ou qui aurait pu l'être par une restriction à un sous-groupe bien choisi. Le résumé (en anglais) de l'étude précise les données à ce sujet :

 

« The rates of HB vaccination in the 3 years before the index date were 24.4% for the 349 cases and 27.3% for their 2,941 matched controls. »

 

Parmi les 349 malades il y a ceux tombés malades dans les 3 ans après la vaccination  dont 85 vaccinés et 803 parmi leurs  témoins associés. Le principe de ce type d'étude n'est pas de comparer le nombre de malades chez les vaccinés et les non-vaccinés comme on pourrait s'y attendre, mais de comparer le nombre de vaccinés chez les malades et les non-malades.

Sur cet exemple on trouve sensiblement moins de vaccinés chez les malades que chez les non-malades. Cette différence n'est pas significative*, ce qui veut dire qu'elle reste compatible avec des variations aléatoires. Elle est cependant à prendre en compte ici car elle peut contribuer à noyer le poisson : il paraît en effet peu vraisemblable que le vaccin soit protecteur de la sclérose en plaque, aussi cette différence pourrait plutôt correspondre à un biais de recrutement des témoins* qui aurait favorisé la sélection de témoins vaccinés et donc réduit l'estimation du risque relatif pour les sous-groupes où il devient significatif.

 

Ainsi, les estimations de 1,74 et de 2,77 pour ce risque pourraient être en réalité plus élevées.

Comme le rapporte cette critique n° 2 de la Commission, les auteurs de l'étude avaient mentionné ce biais qui aurait favorisé la sélection de témoins plus vaccinés que la population générale et réduit l'estimation des risques relatifs. Il est curieux de constater que la Commission de pharmacovigilance transforme ce biais en effet "protecteur" du vaccin mais conserve cependant les guillemets !

* Mon article annoncé au début reprend cette question du biais de sélection en proposant une autre hypothèse qui me parait beaucoup plus crédible.


Des critiques bien spécieuses

 

On peut aussi s'interroger sur la signification de cette phrase : " absence de différence de taux d’observance aux recommandations entre les cas et les témoins". Elle est en contradiction apparente avec le fait que ces observants sont significativement plus nombreux chez les malades que chez les témoins, du moins pour un délai supérieur à 3 ans alors que ce n'est pas le cas pour un délai de 1 à 2 ans, où le risque relatif de 0,45 est encore très bas et pourrait exprimer le même biais de sélection des témoins.

On peut regretter que le résumé des débats soit aussi peu explicite et se demander à quel public et pour quel objectif un tel document est destiné.


On peut aussi se poser la question suivante : si une personne reçoit uniquement le vaccin hépatite B et pas les autres, sera-t-elle à risque de SEP de la même façon ? On peut concevoir que le vaccin hépatite B seul ne déclenche pas de SEP et que le BCG seul par exemple fasse de même mais que l'addition des 2 vaccins dans l'organisme devienne explosif. Mais comme il n'existe pratiquement pas d'individus n'ayant eu que le seul vaccin hépatite B il est impossible d'étudier le problème par des statistiques. C'est sans doute à ce type d'études que la dernière phrase fait allusion " statut vaccinal spécifique contre l'hépatite B". Ils savent pourtant qu'une telle étude est impossible actuellement.

 

« Effet "protecteur" du vaccin chez les non observants au calendrier vaccinal ? »

 

La Commission  regrette que les auteurs de l'étude n'aient pas étudié le sous-groupe des enfants "non observants au calendrier vaccinal", c'est à dire ceux qui n'avaient pas reçu tous les vaccins recommandés et qui étaient moins vaccinés que les autre car, compte tenu de l'ensemble des résultats, elle pense qu'on aurait constaté un effet "protecteur" du vaccin. Cela ne veut pas dire que la Commission pensait sérieusement que le vaccin hépatite B pourrait protéger de la SEP mais qu'elle aurait cependant été satisfaite de constater que chez ces enfants le risque relatif était significativement inférieur à 1, prouvant ainsi que le vaccin n'était pas si dangereux que cela à défaut d'être protecteur.

 

La mise en évidence dans cette étude de nombreux risques relatifs nettement inférieurs à 1 a donné à penser aux auteurs qu'il existait un biais de sélection des témoins (les non malades) qui aurait favorisé la sélection de témoins vaccinés. 

Je renvoie à nouveau à mon article de mars 2011 sur ce biais supposé de sélection des témoins.

« Influence du statut vaccinal global sur la relation entre vaccination hépatite B et risque de SEP. » 

 

C'est la question posée par la Commission qui déclare regretter que le problème n'ait pas été étudié...Mais que dira-t-elle si une nouvelle étude confirmait que les autres vaccinations exacerbent la capacité du vaccin hépatite B à déclencher des SEP  ?


On mettrait ainsi en évidence que le vaccin hépatite B serait rendu particulièrement dangereux pour le système nerveux central quand, cerise sur le gâteau, il vient parachever un programme vaccinal particulièrement chargé. Et si inoculé seul, sans aucun autre vaccin, ni simultanément, ni avant, ni après, le vaccin hépatite B était parfaitement inoffensif et que c'était l'accumulation des autres vaccins qui le rendait ainsi agressif ?  Pourquoi pas ?

 

 

Critique n° 3

 

« les analyses en sous-groupes conduisent à réduire considérablement les effectifs et les résultats mis en évidence par les auteurs ne concernent finalement qu’une part minoritaire de la population initialement incluse dans l’étude. Dans ces sous-analyses, le nombre de cas de démyélinisations aiguës et de SEP confirmées sont respectivement de 163, soit 46,7% de l’effectif initial et de 72, soit  48 % de l’effectif initial des enfants avec une SEP confirmée. L’ensemble de ces diminutions d’effectifs comporte un risque inévaluable de biais de sélection. »

 

Bien sûr qu'en s'intéressant à des sous-groupes il y aura une réduction des effectifs ! Ils sont presque 50% du total initial, ce n'est donc pas une réduction si considérable que cela. Le problème est seulement de savoir s'ils sont malgré tout suffisants pour mettre en évidence un sur-risque de façon significative. Avec 163 affections démyélinisantes dont 72 SEP il y a suffisamment pour pouvoir travailler. Quand on pense qu'Hernan avait présenté des résultats significatifs avec seulement 11 SEP chez les vaccinés !

Une expression comme minoritaire est parfaitement déplacée dans un tel contexte : tout le monde ne réagit pas de la même façon au même vaccin, il est donc très utile de chercher les causes de ces différentes réactions. Si en étudiant séparément les blonds, les bruns, les châtains et les rouquins on mettait en évidence que les rouquins font très significativement plus de SEP que les autres après vaccination hépatite B on aurait là un résultat très intéressant qui pourrait conduire, en particulier, à se montrer plus prudent pour la vaccination des rouquins, même si ceux-ci sont minoritaires dans la population. Cela pourrait aussi orienter les recherches sur la responsabilité de certains gènes.

Si on veut étudier la répartition des blonds, bruns, châtains et rouquins dans la population française, le fait de se limiter à ceux d'origine normande pourrait donner un plus grand nombre de rouquins que la moyenne globale française mais faudrait-il pour autant interpréter cela comme un biais ? Ce pourrait être très valable pour la Normandie. Tout dépend de ce qu'on cherche.

 

 

Critique n° 4

 

« Une augmentation du risque dans le sous-groupe observant aux recommandations vaccinales ne trouve pas d’explication très plausible sur le plan médical. Elle pourrait suggérer une interaction entre la vaccination VHB et les autres vaccinations ce qui n’est pas en accord avec les connaissances scientifiques actuelles. »

"Pas d’explication très plausible sur le plan médical, pas en accord avec les connaissances scientifiques actuelles," 

Peut-être, mais c'est l'occasion justement pour se pencher sur la valeur des connaissances actuelles !  Si un fait est en désaccord avec des théories ou des croyances, ce sont ces dernières qu'il faut réexaminer et non pas le fait qu'il faut rejeter sans examen. C'est toute la différence entre la démarche scientifique authentique et le dogmatisme si répandu et d'abord dans la science elle-même car la nature humaine ne change pas si facilement...La science a aussi ses Grands Prêtres...

 

Critique n° 5

 

« Les résultats des analyses réalisées en fonction du délai entre la vaccination et la survenue d’un évènement démyélinisant aigu ne montrent pas de cohérence. En effet, dans la sous-analyse des enfants observants aux recommandations vaccinales, l’Odds Ratio (risque relatif) est de 0,45 (IC95% =[0,20-1,01]) pour un délai compris entre 1 et 2 ans soit presque une protection significative tandis qu’il passe à 1,50 (IC95% = [0,93-2,43]) lorsqu’un délai de plus de trois ans avant l’épisode est considéré. Ce même constat est également retrouvé avec les épisodes de SEP.

D’autre part, ces résultats n’apparaissent pas non plus cohérents avec les résultats de Hernan et al. qui étaient augmentés de façon significative dans la période ≤ 3 ans. Ici, ils ne sont pas augmentés lorsqu’une période ≤ 3 ans avant l’épisode est considérée. »

 

Ces résultats suggèrent simplement qu'il faut chez les enfants un "délai d'incubation" d'au moins 3 ans. Avec quoi cela serait-il incohérent ? Va-t-on soutenir qu'il n'y a pas de cohérence entre l'enfantement et un rapport sexuel sous prétexte qu'il n'y a pas de différence significative dans les 6 premiers mois, qu'au contraire même on n'observe pas de naissances pendant cette période et qu'il faut attendre au moins 8 mois pour cela...N'envisager une relation de cause à effet que si l'effet est quasi immédiat est une réaction infantile et puérile.

C'est surtout l'incohérence de la Commission qui est manifeste dans la seconde partie du texte : l'étude d'Hernan portait sur des adultes, le plus jeune ayant 18 ans, alors qu'on sait que les SEP sont beaucoup moins fréquentes chez les enfants que chez les adultes. Selon le Livre Blanc de la SEP, environ 75% des SEP apparaissent entre 20 et 44 ans. Il pourrait y avoir là une raison pour comprendre que des adultes peuvent enclencher le processus conduisant à la démyélinisation beaucoup plus rapidement que des enfants.

Ils auraient aussi pu citer l'étude de pharmacovigilance de Fourrier-Costagliola qui met en évidence une différence des plus significatives en ne prenant que les cas apparus dans les 2 mois qui suivent une injection de vaccin hépatite B, mais uniquement sur des adultes entre 20 et 44 ans, c'est à dire pendant la période de la vie la plus favorable à ce type de manifestation.


 

Une grosse faute méthodologique

 

Se référer aux conclusions de l'étude d'Hernan signifie qu'on accepte celles-ci, bien évidemment. Il est donc assez cocasse de constater qu'après avoir multiplié les arguments pour invalider ses conclusions en avançant des fautes méthodologiques, les mêmes Commissions n'hésitent pas à faire valoir les conclusions de cette étude pour en invalider une autre !!!

Ce n'est pas la première fois qu'on assiste à un tel scénario : en septembre 1994 la Commission mondiale de sécurité des vaccins travaillant sous l'égide de l'OMS (le GACVS) avait avancé les résultats observés par la pharmacovigilance française (Fourrier-Costagliola) pour jeter le doute sur l'étude d'Hernan.  La pharmacovigilance française mettaient en évidence une différence des plus significatives en retenant seulement les cas apparus dans les 2 mois après une vaccination alors qu'Hernan n'obtenait pas de différence significative sur une durée d'un an et qu'il avait dû prolonger jusqu'à 3 ans pour cela. Mais une telle critique n'est possible que si on admet que l'étude Fourrier-Costagliola était significative, ce qui avait été refusé en son temps par cette Commission...(sur cette étude voir mon article "il n'y a pas que les enfants").

 

 

 

 

Critique n° 6

 

« Conclure à une différence entre Engerix B® et les autres vaccins parce que le lien avec le risque de SEP est significatif pour Engerix B® et non significatif pour les autres vaccins procède d’une erreur d’interprétation. En l’absence d’un test d’interaction significatif, une telle conclusion est très contestable, et les intervalles de confiance des OR (risques relatifs) des différents vaccins se chevauchant largement, une interaction significative ne pourrait être démontrée. »

 

 

Conditions

Durée après vaccination

Odds ratio (risque relatif)

Intervalle de confiance  95%

Tous

< à 3 ans

0,74

0,54          1,02

Tous

> à 3 ans

0,93

0,65         1,31

Observants calendrier dont VHB

Entre 1 et 2 ans

0,45

0,20         1,01

Observants calendrier dont VHB

> à 3 ans

1,50

0,92         2,43

Observants calendrier avec Engerix B

> à 3 ans

1,74

1,03         2,95

Observants calendrier et Engerix B SEP seules

> à 3 ans

2,77

1,23         6,24

 

 

A priori, si " l'hypothèse nulle" est vraie,  les risque relatifs mesurés pour les 160 sous-groupes traités par l'équipe du professeur Tardieu devraient se répartir équitablement de part et d'autre de la valeur 1. Ce serait facile à vérifier pour les auteurs de cette étude, tous les résultats n'ayant pas été publiés. Si on constatait une anomalie avec beaucoup plus de risques relatifs inférieurs à 1, comme les résultats ci-dessus pourraient le suggérer, on aurait confirmation, non pas d'un effet protecteur du vaccin contre la sclérose en plaques mais de l'absence d'indépendance entre les groupes et d'un biais de sélection des témoins qui avantagerait le vaccin.

Il aurait aussi été intéressant de connaître l'évaluation des risques relatifs pour les sous-groupes suivants :

 

                            Conditions

  Durée

Chez les non-observants du calendrier

> à 3 ans

non-observants calendrier mais avec l'Engérix B

> à 3 ans

non-observants calendrier, avec Engerix B et avec SEP

> à 3 ans

 

Ainsi, on pourrait comparer par exemple les risques relatifs  entre ceux qui, ayant une SEP et ayant été vaccinés avec l'Engerix B, avaient reçu ou non tous les vaccins recommandés. On peut noter une erreur manifeste de méthodologie : ayant constaté que les rouquins vaccinés contre l'hépatite B  faisaient plus de SEP que les autres, ils compareraient avec l'ensemble, c'est à dire avec aussi les rouquins dans ce groupe, pour dire que les écarts ne sont pas si importants ("les intervalles de confiance des risques relatifs des différents vaccins se chevauchant largement"  disent-ils), alors que le maintien des rouquins réduit évidemment cet  écart. 

D'ailleurs si les écarts ne sont pas si importants entre les vaccinés avec l'un ou l'autre des 2 vaccins, c'est peut-être tout simplement parce qu'ils sont l'un et l'autre actifs pour le risque de SEP ? D'ailleurs, selon l'article du 25 septembre du journal Le Monde, ce risque ne pouvait être exclus :

 

"Les auteurs précisent que leur étude ne permet pas d'écarter un risque accru avec un autre vaccin, le GenHevacB."

Revenons sur cette affirmation :

 

« La probabilité de détecter une association significative par le simple fait du hasard est très élevée. »

La Commission a souligné avec force ce problème en faisant valoir la multiplicité des tests pratiqués, environ 160, et l'augmentation du risque dit de première espèce qui l'accompagne, c'est à dire le risque de rejeter une hypothèse vraie.

Ainsi, en réalisant 160 tests à 5% on pourrait avoir en moyenne 8 tests significatifs par le seul fait du hasard alors qu'il semble qu'il n'y en ait eu que 2, ce qui est significatif d'une anomalie. Elle peut s'expliquer par le fait qu'il faut au moins une hypothèse pour cela : que les 160 sous-groupes testés soient indépendants. Or, ils ont été pris parmi 349 malades et il paraît pratiquement impossible d'avoir 160 sous-groupes indépendants parmi aussi peu de personnes. S'il y en avait 50 ce serait déjà très beau, mais cela ferait seulement 2,5 tests significatifs attendus sous le seul effet du hasard, aussi l'argument s'effondre.

Il s'effondre d'autant plus que ces tests significatifs devraient aussi se répartir d'un côté comme de l'autre, or il semble bien, selon ce qui a été communiqué, qu'aucun sous-groupe testé n'a donné un résultat significativement "protecteur". De plus, le biais de sélection dans le sens d'un excès de témoins vaccinés aurait dû favoriser l'obtention de tests significatifs "protecteurs" et défavoriser les tests défavorables au vaccin. Malgré cela, il y a au moins 2 tests significatifs défavorables, celui donnant le risque moyen de 2,77 et celui donnant 1,74 car 1 n'appartient pas aux intervalles de confiance.  Un troisième test, correspondant au risque moyen de 1,50, a aussi le potentiel pour devenir significatif en tenant compte de ce biais.

Force est de constater qu'il existe un déséquilibre des tests significatifs du côté "non protecteur", ce qui n'est pas en faveur d'une action du risque de première espèce bien au contraire. De plus, la probabilité d'obtenir un risque moyen de 2,77 ne dépasse pas 1% et correspond donc à un niveau de test beaucoup plus exigeant que celui initialement prévu de 5% : en l'absence d'action défavorable du vaccin il y avait moins d'une chance sur 100 d'obtenir un écart aussi grand par rapport à 1. Le biais de sélection des témoins conduirait encore à réduire cette probabilité : la probabilité d'obtenir un risque relatif d'au moins  2,77 par rapport à 1 est ici de 0,7%; par rapport à 0,9 elle serait de 0,33%; par rapport à 0,8 de 0,136%; de 1,8/100000 par rapport à 0,5*.

On voit que tous ces arguments sont au contraire très en faveur de différences significatives liées à une cause agissante particulière et non pas aux seuls caprices du hasard.

* Pour ces calculs on trouvera la formule nécessaire sur ce site

Avec les notations utilisées sur le site, on pourra calculer la quantité V grâce à l'intervalle de confiance à 95%  [1,23  6,24] et le rapport de cotes 2,77, ce qui permet alors de calculer par exemple l'intervalle de confiance à 99% même en ignorant les 4 valeurs définissant V.

 

 



                                     Annexe

 

On finirait par croire, à les entendre, qu'ils serait interdit de prendre un sous-groupe dans une cohorte ! Si le résultat avait été favorables aux vaccins auraient-ils fait autant de bruit pour dénoncer cela comme une erreur de méthodologie ? Pourtant, cette démarche est très fréquente dans les études de cohortes, et même indispensable voire incontournable. En voici un exemple pris dans une revue médicale suisse sur le traitement de cancéreux.

Apparemment, les auteurs n'éprouvent aucune crainte particulière à considérer des sous-groupes au cours de leur étude. Bien sûr il faut s'assurer que le sous-groupe a de bonnes caractéristiques, comme pour tout groupe sur lequel on fait une étude pour tenter d'en tirer des connaissances à appliquer ensuite à toute une population.

 


 

L’admission en réanimation des patients avec néoplasie de mauvais pronostic  

 

Dans une cohorte étudiée par Groeger, la mortalité prédite était de 22% et la mortalité observée de 41%. Les patients receveurs de greffe de moelle osseuse allogène représentent un sous-groupe particulier. On sait qu'ils sont à haut risque de complications respiratoires nécessitant des soins intensifs et que leur survie, s'ils doivent être soumis à une ventilation mécanique, est extrêmement faible. Rubenfeld et Crawford, dans la cohorte précédemment citée, mentionnent une survie hospitalière de 6,1%. Ils ne retrouvaient aucun survivant parmi les patients qui présentaient, en plus de l'insuffisance respiratoire, une insuffisance hépatique et rénale ou la nécessité d'un traitement vasopresseur, un sous-groupe représentant 46% de la cohorte.

 

 

 

 

 

[1] http://www.afssaps.fr/var/afssaps_site/storage/original/application/44c88f6d7ce134fc2c4f0a337ce33109.pdf  

  Compte-rendu du 30 septembre 2008

[2] http://questionvaccins.canalblog.com/archives/2008/10/10/10900195.html

[3] http://www.arme.u-bordeaux2.fr/armep_doc/livre_lalettre.pdf