Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
La Question des Vaccins
30 novembre 2010

Le pourquoi du fiasco des modèles mathématiques pour la grippe

Cet article a été enrichi le 13 décembre 2010 : modélisation de la propagation dans une classe (annexe) ; le 7 janvier 2011 : l'importance des cloisonnements (complément);  le 17 juin 2011 : remarques sur les incohérences des modélisations SIR et SEIR par systèmes différentiels (faut-il les mettre à la poubelle ?),  le théorème du seuil  selon le modèle Reed et Frost (annexe).

J'ai fait une présentation poster de cet article au congrès de la Sfsp les 2-4 novembre 2011 à Lille.

Additif du 12 aout 2017 : on peut, le cas échéant, consulter ce mémoire d'élèves ingénieurs tout en sachant qu'il s'agit d'un mémoire réalisé au cours de leur cycle d'études dans le module Sciences humaines (2014-2015). En particulier ils présentent des modèles par systèmes différentiels dont je dénonce ici les limites criardes alors qu'ils ignorent le modèle Reed et Frost présenté ci-dessous et qui est beaucoup plus intéressant et très connu aux Etats Unis. Il s'agit en fait d'un mémoire plutôt "conformiste" comme souvent quand ils ont été réalisés par des élèves qui s'initient à une discipline en l'étudiant à travers ses publications.

http://eleves-ingenieurs.mathematiques.insa-rennes.fr/wp-content/uploads/2015/05/Les-Math%C3%A9matiques-au-service-de-lEpid%C3%A9miologie.pdf

Fin additif

 

Il est devenu patent et publique que les modélisations de la pandémie grippale avaient donné des estimations très largement au dessus de ce qui a pu être observé partout (voir annexe). Pourquoi  cela ? Il  en existe certainement plusieurs raisons pouvant ajouter leurs effets. Cet article va  en pointer au moins 3.

 

Les épidémiologistes ont introduit le paramètre qu'ils notent R0* et qu'ils appellent taux de reproduction de base. Il représente le nombre de personnes contaminées par un contagieux au cours de sa période de contagion. Ce R0 est généralement supposé constant dans le temps et uniforme sur l'ensemble de la population considérée. En pratique chacun se doute que ces conditions ne sont pas réalisées mais on peut penser (espérer) qu'une valeur moyenne de R0 permettrait malgré tout de modéliser la réalité plus complexe voire embrouillée.

Nous allons voir que malheureusement il n'en va pas toujours ainsi.

* Voici un lien vers une étude (en anglais) sur le paramètre R0

Il est d'abord nécessaire d'expliquer comment construire un modèle élémentaire pouvant représenter la propagation  de l'épidémie sous certaines conditions précises. D'abord quelques définitions :

Il faut préciser que ce sont les contagieux qui propagent la maladie, qu'ils soient malades ou non, c'est à dire qu'ils aient des symptômes ou qu'ils soient asymptomatiques. Nous suivrons donc l'évolution du nombre de contagieux. Ensuite il faut tenir compte de la  durée de l'incubation qui sera, dans cet article*, le moment qui s'écoule entre la contamination et le début de la phase de contagion dont la durée devra aussi être prise en compte. En fait ce seront les durées relatives de  ces 2 phases qui seront importantes. Ici, pour simplifier, nous les supposerons égales bien qu'il soit possible de s'affranchir de cette contrainte. L'unité de temps sera cette durée commune et In désignera le nombre de contagieux au temps n.

* En épidémiologie cette durée est le temps de latence. Voir les définitions

Au temps n+1 ceux-ci cesseront d'être contagieux pour devenir immunisés, ce qui fait qu'ils ne pourront devenir à nouveaux contagieux en cas de nouvelles contaminations. Gn désignera le nombre d'immunisés par la maladie  (guéris) au temps n. Nous supposerons qu'il n'y a pas de décès pendant la durée de l'épidémie et que l'immunité ainsi acquise se maintient pendant toute sa durée. Ainsi, Gn sera la somme de tous les Ik de l'instant initial k=0 à k=n-1.

Il y a les susceptibles c'est à dire ceux qui deviendraient contagieux s'ils étaient contaminés. Leur nombre au temps n sera noté Sn.

Il y a aussi les résistants c'est à dire ceux qu'une première contamination ne rendra pas contagieux. Ce peut être grâce à une résistance naturelle ou acquise comme par exemple par une vaccination. En notant Rn le nombre de résistants au temps n et P la taille de la population on aura Sn=P-Rn-In-Gn car on suppose aussi que des contagieux ne sont pas affectés par une contamination supplémentaire. Pour simplifier  nous supposerons que P est constant (le groupe est fermé) et que  Rn=0, ainsi R0 représentera le nombre de résistants au temps 0. L'épidémie s'arrêtera quand le nombre de contagieux sera inférieur à 1.

 

Pour éviter toute confusion avec le R0 des épidémiologistes je noterai C le nombre de contaminés par un contagieux et l'appellerai indice de contagion* comme je l'ai fait pendant les 10 années où j'ai enseigné le modèle qui va suivre à des étudiants de deug Sciences de la Vie en ignorant qu'il avait été découvert en 1928 par Frost qui l'avait exposé dans plusieurs conférences sans en faire une publication en raison de sa simplicité.

* Ce terme est cependant défini en épidémiologie avec un sens différent.

Il est possible que le R0 des épidémiologistes désigne en fait le nombre de contagieux avec symptômes tant il est vrai qu'étant des médecins ils ont tendance à rester sur des définitions médicales. De plus, il faut reconnaître que leurs définitions ne sont pas toujours très claires...

Il faudra cependant retrouver les papiers de Frost, à une date récente que je ne peux préciser, pour que son travail soit enfin publié. Pourtant il est fondamentalement simple, naturel, efficace, adaptable et je l'avais construit seul, au début des années 1990, en ignorant  tout de son histoire.  Ce n'est pas un exploit, il suffisait pour cela d'aborder le problème sans être influencé par les idées des autres, ce qui est le plus difficile en recherche comme l'illustre d'ailleurs cette histoire.

 

Le modèle de Reed et Frost

Jacques, qui est contagieux, contamine  au hasard C personnes distinctes  parmi les P-1 personnes autres que lui-même. En supposant que les contaminations se font de façon aléatoires dans tout le groupe, Paul aura la probabilité C/(P-1) de faire partie des C personnes contaminées par Jacques. La probabilité pour qu'il ne soit pas contaminé par Jacques sera donc 1-C/(P-1). Comme il existe In contagieux au temps n et que les contaminations sont supposées être indépendantes les unes des autres, la probabilité pour que Paul ne soit contaminé par aucun des contagieux sera [1-C/(P-1)]^In ( ^ représente la fonction puissance ). La probabilité pour qu'il soit contaminé par l'un au moins de ces In contagieux sera alors   1-[1-C/(P-1)]^In.

On obtiendra le nombre moyen de contagieux au temps n+1 en multipliant cette probabilité par le nombre Sn de susceptibles, d'où la formule :

                            In+1={1-[1-C/(P-1)]^In}xSn

On aura aussi Sn+1=Sn-In et Gn+1=Gn+In

Ce lodèle est aujourd'hui proposé aux élèves par l'Education Nationale [1]. On peut aussi l'utiliser sous forme probabiliste (ou stochastique) en prenant pour In+1 une valeur aléatoire associée à la loi binomiale associée à Sn et la probabilité pour un individu d'être contaminé. En faisant un assez grand nombre de simulations on peut alors estimer la dispersion par rapport à la propagation moyenne.

 

Voici ce qu'on peut lire dans la revue Prévalence de l'InVS (n°11 octobre 2004) :

«Wade Hampton Frost (1880-1938) est considéré comme le père de l'épidémiologie américaine moderne. Toujours soucieux d'expliquer, il crée en 1928 avec son collègue Lowell Reed, professeur de biomathématiques à Johns Hopkins, un modèle de formalisation mathématique de la transmission des maladies. Modeste, il ne songera jamais à le publier, même si celui-ci est utilisé dans le monde entier sous le nom de modèle Reed-Frost. Ce n'est que très récemment que ce dernier a été enfin publié, grâce au texte d'une conférence retrouvé dans ses archives. La postérité saura pourtant reconnaître ses mérites, puisque le Wade Hampton Frost Award est aujourd'hui le prix de référence dans le domaine de l'épidémiologie »

 

 

 

Si on applique ce modèle à un groupe de 1000 personnes avec C=2 on obtient au total 797 cas avant la disparition de l'épidémie avec par exemple 1 cas initial mais ce n'est pas essentiel. Près de 80% de cas c'est beaucoup trop puisque le nombre total de cas de grippe dépasse très rarement 50% ce qui  fait plus que suggérer que les hypothèses du  modèle ne traduisent pas la réalité de façon satisfaisante. Il faut donc rechercher pourquoi.

Beaucoup se joue dans les familles où, le plus souvent, des adultes revenant de leurs travail,  des lieux de commerces ou des transports en commun retrouvent leurs enfants revenus de l'école. Ainsi, des contamination inter-familiales pourraient permettre au virus de rebondir dans de nouvelles directions.

Mais au contraire, si les personnes contaminées deviennent contagieuses à leur domicile, elles pourraient, en devant rester  au lit, ne pas transmettre le virus ou de façon très limitée. L'importance de cela pourrait être attesté par le fait que les enquêtes épidémiologiques effectuées en 2009 sur des classes et des colonies de vacances ont montré des taux d'attaque très supérieurs dans les colonies de vacances où les enfants restent ensemble jour et nuit pendant toute une semaine. On peut lire à ce sujet les enquêtes relatées dans le BEH du 21 septembre 2010.

 

Autrement dit, pour le virus la cellule familiale peut aussi bien être un tremplin qu'une poche dans laquelle il va s'enferrer, et vraisemblablement plus souvent une poche qu'un tremplin même si, en pratique il est fort vraisemblable que les 2 situations se produisent. Le problème est alors le suivant :

est-il possible de remplacer cette double possibilité, même avec des variations aléatoires autour des valeurs moyennes comme dans les modèles stochastiques, par une propagation moyenne et uniforme ?

 

 

Si par exemple, à chaque temps n la moitié des contagieux contamine 3 personnes alors que l'autre moitié n'en contaminera qu'un seul, on trouve aussi 797 cas au total. Mais on a ici une loi de propagation constante dans le temps. Il en ira tout autrement quand ce ne sera plus le cas :

 

Quand l'indice de contagion varie au cours du temps

Dans un groupe de 1000 personnes l'épidémie se propage un temps sur 2 avec C=2 et, pour l'autre temps, seulement la moitié des contagieux potentiels contamineront effectivement avec aussi C=2, les autres ne contaminant aucune personne. ce qui pourrait paraître presque équivalent  à diviser C par 2 un temps sur 2.

La condition initiale est 1 cas contagieux mais ce choix n'est pas essentiel. Le nombre moyen total de cas contagieux sera 524,16 et le nombre moyen de cas aux temps pairs où la totalité des contagieux contaminent effectivement chacun 2 personnes est 307,34. On peut ainsi calculer l'indice de contagion  moyen Cm qui est le rapport entre le nombre total de contaminés,  y compris les doublons et les immunisés,  par le nombre total de cas, soit  ∑(2In+2x1/2xIn+1) divisé par ∑(In+In+1) les sommes étant effectuées  pour n pair. On retrouve la somme des In+In+1 au numérateur ce qui permet d'écrire Cm=1+∑In / ∑(In+In+1) pour n pair soit 

      Cm=1+ 307,34/524,16=1,586.

En reprenant cette valeur pour définir une propagation constante et uniforme parmi les 1000 personnes le  modèle de Reed et Frost donne 634,67 cas au total, soit plus de 110 cas en plus, soit 11% des 1000 personnes du groupe (ou 21% de cas en plus), valeurs qui se maintiennent en faisant varier la taille P du groupe. Pour par exemple P=100 j'obtiens 53,75 cas contre 64,84 soit aussi 11% d'écart (ou 20,6% en plus).

Ce sont des écarts énormes !

Le constat de cette observation conduit à dire :

il ne sera pas toujours possible de remplacer un indice de contagion variable et non homogène par un indice moyen

même quand ces variations sont alternées et périodiques ce qui paraît pourtant favorable. Pour avoir des modèles plus réalistes il faudrait pouvoir modéliser ce type de variation et donc avoir une idée de ce qu'elles peuvent être en pratique, ce qui demanderait des enquêtes épidémiologiques de terrain assez précises.

 

Dur, très dur !!!

Oui, je pense, sans exagération, que c'est un très gros coup dur pour les tentatives de modélisation  de maladies comme la grippe car si on peut faire varier aisément et à volonté l'indice de contagion (le R0) ainsi que la proportion de contagieux effectifs parmi les contagieux potentiels, il ne sera pas aisé d'avoir des séquences réalistes de ces variations.

Mais il faut bien qu'il y ait quelque chose pour expliquer le fiasco des modélisations qui donnent beaucoup trop de cas. Ça pourrait être un des points majeurs. Il y en a d'autres présentés plus loin.

 

L'exemple  que j'ai donné n'est pas totalement arbitraire, il pourrait correspondre, de façon simplifiée, à l'alternance des jours ouvrés et de congés : si un contaminé devient contagieux et malade pendant le week-end il n'ira pas travailler le lundi et ne pourra contaminer que sa famille, ce qui se produit aussi, certes mais pas systématiquement.

Par contre, si à chaque temps n la moitié des contagieux contaminent chacun 3 personnes et l'autre moitié une seule, la moyenne des contaminés sera 2 par contagieux et cette valeur moyenne donnera le même nombre total de cas. Cette situation a pu tromper en faisant croire qu'il en serait toujours ainsi.

 

Voici un extrait du REH (publication OMS hebdomadaire) n°34 du 21 août 2009 et intitulé ''Modélisation mathématique de la grippe pandémique H1N1 2009''. Il porte sur l'évaluation du fameux R0 mais à aucun moment il n'est envisagé des variations selon les jours de la semaine, en particulier entre les jours ouvrables et chômés. Ou plutôt pensent-ils sans doute que ces variations seront gommées par une valeur moyenne. On vient de voir que ce n'était pas toujours possible alors que l'extrait ci-dessous montre qu'ils recherchent les variations du R0 entre les Etats !!! :

« La plupart des analyses des données provenant d’Europe et des États-Unis laissent à penser que le R0 se situe très probablement entre 1,2 et 1,7, avec des estimations plus élevées dans des  particuliers (par exemple, au Japon R0 = 2,3; intervalle de confiance à 95% [IC]: 2,0 2,6; en Nouvelle Zélande R0 = 1,96; IC à 95%: 1,80 2,15; dans l’État de Victoria (Australie) le R0 était initialement >2 mais a chuté au cours de la phase d’endiguement; en Argentine et au Chili R0 >1,7). Des différences dans le R0, même de cet ordre, peuvent avoir des répercussions profondes sur la mesure dans laquelle les interventions peuvent permettre de maîtriser une épidémie. »

 

Retenons ces R0 entre 1,2 et 1,7 qui paraissent très bas,  trop  bas, j'y reviendrai à la fin. On y lit aussi ceci qui est particulièrement révélateur des limites de leurs modèles :

« Les modèles peuvent donner une limite supérieure des taux d’atteinte si l’on dispose d’une estimation précise du R0, mais de tels modèles fournissent des estimations des taux d’atteinte sérologiques (proportion de sujets infectés) et non la proportion de sujets infectés montrant des symptômes cliniques. »

Il y a  dans ce propos 2 aspects très différents :

1- Ils traduisent ce que je nomme ''les contagieux'' par ''les sujets infectés'' c'est à dire avec une sérologie positive. Je ne suis pas certain que ce soit la même chose en ce sens qu'on doit pouvoir avoir une sérologie  positive ou augmentée après le passage du virus (relance d'une immunité acquise) sans pour autant avoir été contagieux (ou alors la vaccination ne pourrait s'opposer à la propagation). Or les modèles ne peuvent que suivre l'évolution du nombre de contagieux et non du nombre de séropositifs. Resterait à savoir si ces 2 termes sont vraiment synonymes.

2- Ils considèrent comme allant de soi qu'une estimation précise du R0 donnerait une indication  alors qu'une  propagation obéissant à des lois variables dans le temps et l'espace ne peut pas être modélisée par le seul R0 moyen.

Ils s'intéressent cependant aussi aux taux moyens d'attaque dans les familles et autres communautés :

« mieux comprendre la dynamique de la transmission du virus pandémique dans divers lieux (par exemple estimer le taux de reproduction de base R0 et les taux d’atteinte secondaire, dans les écoles, les ménages et plus largement, les communautés des pays touchés), »

Là aussi c'est insuffisant car le taux d'attaque dans une famille donne la proportion de membres de cette famille qui sont atteints en moyenne quand un membre de la famille aura été atteint. Mais il ne renseigne pas sur le nombre de familles touchées.

Le REH déjà cité précise au sujet du taux d'attaque dans les familles :

« Les analyses des taux d’atteinte secondaire dans les ménages, effectuées à Hong Kong (région administrative spéciale de Chine), en Italie, au Mexique, au Royaume-Uni et aux États-Unis, ont été relativement concordantes, ces derniers se situant entre 18 et 30%. »

On voit donc qu'il s'agissait d'un taux d'attaque assez modéré, très éloigné des scénarios catastrophes qui nous avaient été promis.

 

Plutôt que de ''penser'' au niveau du monde (ce qui me parait très illusoire) il paraît certain que beaucoup se joue dans les familles selon qu'elles seront un tremplin ou un amortissement pour le virus. Trois auteurs, L Pellis, N.M Ferguson et C Fraser ont publié une étude où la population est ainsi partagée en familles, les adultes se rendant sur des lieux de travail et les enfants dans des écoles :

« In this paper, we present a model for the spread of a permanently immunizing infection in a population socially structured into households and workplaces/schools, and we propose and discuss a new household-to-household reproduction number RH for it. »

Aussi, ils ont introduit l'analogue du R0 mais entre les familles et non plus les individus qu'ils notent RH, H comme Home : 

« we define RH as the average number of households infected by a typical household in a totally susceptible population. Now, the infection can exit from a household following two routes: via a global infection or via a workplace infection, i.e. when an infected individual in the household triggers an epidemic in their workplace and all those ultimately infected are primary cases in new households. »

 

Mais ils supposent que RH est homogène parmi les familles et constant au cours du temps, autrement dit ils lui attribuent une valeur moyenne ( average number) supposée assurer une propagation proche de la réalité. Ils ne semblent pas avoir réalisé que l'alternance d'appartenance de chaque individu à sa famille et à son travail créait une situation qui ne peut être modélisée par les seules valeurs moyennes.

 

Second exemple : une propagation  non homogène

Il y a 1000 hommes et 1000 femmes dans le groupe avec un indice de contagion C=2 constant   (C désigne le R0 des épidémiologistes). Le nombre total de cas sera 797x2=1594 si l'épidémie s'y propage de façon aléatoire.

Supposons maintenant qu'un homme contagieux contamine C1 hommes et C2 femmes alors qu'une femme contagieuse contamine C'1 hommes et C'2 femmes*. Il est possible d'adapter le modèle de base à cette situation :  In et I 'n étant les incidences au temps n chez les hommes et les femmes, la  probabilité pour un homme d'être contaminé sera

  1-(1-C1/999)^In*(1-C'1/1000)^I 'n     (* signe de multiplication) Les femmes contagieuse sont en dehors du groupe des hommes.

Cette probabilité sera à multiplier par le nombre d'hommes susceptibles pour obtenir l'incidence au temps n+1 chez les hommes et de même pour les femmes.

* L'indice indique le sexe des contaminés (1 pour les hommes, 2 pour les femmes), le signe ' ou son absence indique le sexe du contaminant ( ' pour les femmes, absent pour les hommes).

 Remarque : une formule analogue permet de modéliser la situation où la contagion n'est pas répartie de façon homogène au cours de la période de contagion. Le malade peut, par exemple, contaminer davantage au début de sa maladie qu'ensuite. On partage alors la période de contagion en deux en leur associant des indices de contagion C1 et C'1 et où I ' désignera alors l'incidence au temps n-1. Ceci montre la remarquable adaptabilité de ce modèle.

Cas 1

Prenons C1=1,5  C2=0,5  C'1=0,5 et C'2=1,5.  Autrement dit les contaminations sont symétriques entre les hommes et les femmes. On obtient 797 hommes et autant de femmes contaminées soit 1594 au total avec au départ un homme et une femme contagieux mais ce n'est pas essentiel. On notera que C1+C2=C'1+C'2=2 exprimant que chaque homme et chaque femme contaminent 2 personnes.

Cas 2

C1 et C2 sont inchangés alors que C'1=C'2=1 d'où C'1+C'2=2,  avec toujours au départ un homme et une femme contagieux.  On obtient au total une moyenne de 858,6 hommes contaminés et 665,9 femmes  contre les 797 attendus  chez les hommes et chez les femmes (7,7% de cas en plus pour les hommes, 16,45% en moins pour les femmes). Au total 1524,5 cas contre 1594 soit  une augmentation de 4,6% de cas quand on remplace par la valeur moyenne de la contagion qui en annonce 1594.

 

Troisième exemple : des sous-groupes non égaux

Dans la situation précédente il y avait le même nombre d'hommes que de femmes. Soit maintenant 10 hommes pour 100 femmes, proportion qui pourrait se rencontrer chez les soignants d'un hôpital ou, à l'inverse, dans une école militaire ou sur un navire de guerre, voire même un sous-marin...

Avec C=2 homogène et constant pour un groupe de 110 personnes on obtient en moyenne 88 cas en tout (80%).

Cas 1

Reprenons la même  répartition symétrique du cas 1 du second exemple, soit C1=1,5  C2=0,5  C'1=0,5 et C'2=1,5 ce qui ne changeait rien quand les 2 groupes étaient égaux. On obtient ici 10 hommes et 64 femmes atteints à la fin de l'épidémie soit  74 en tout au lieu de 88  (67,3% de 110 au lieu de 80%) c'est énorme. Notons qu'on ne peut faire valoir ici des écarts qui ne seraient pas significatifs car ce sont des valeurs théoriques et non observées et les valeurs 100 et 10 sont faibles. De plus, ces proportions se maintiennent avec des populations plus importantes.

 

Cas 2

Prenons maintenant la règle de contagion du cas 2 du second exemple avec C'1=C'2=1. On obtient alors 10 hommes touchés et 29 femmes soit 39 au total au lieu de 88 (35,5% de 110 au lieu de 80% !!!)

Si on inverse en prenant 100 hommes et 10 femmes avec la même loi de contagion on obtient 37 hommes et 9 femmes soit 46 soit 41,8% de110.

 

Quatrième exemple : on combine les trois !

Si on s'amuse maintenant à mixer les situations décrites dans les 3 exemples en modifiant ainsi le dernier cas exposé : alternativement, un temps sur 2,  seulement la moitié des contagieux potentiels contamineront effectivement. On trouve alors 9 hommes et seulement 11 femmes soit 20 au total soit seulement 18,2% de 110. ! Ce résultat peut surprendre mais il s'explique ainsi : très rapidement presque tous les hommes sont atteints, aussi seules les femmes vont se contaminer entre-elles mais l'indice de contagion  chez les femmes vaut  alternativement 1 et 0,5  ou, plus précisément, une fois sur deux alternativement, seule la moitié des femmes contagieuses contamineront effectivement.

 

J'ai trouvé sur ce lien une présentation amusante de l'un des problèmes soulevés ici  :

"Rien ne peut arrêter un R0 constant, 1, 2, 4, 8, 16...sauf de tousser sur sa manche ..."

http://www.influenzah5n1.fr/index.php?topic=10522.msg29158#msg29158 

ANNEXE

 

En juin 2009 l'école élémentaire du Jeu  de Paume à Créteil a été l'objet d'une épidémie par le virus H1N1 nouveau. Ces enfants étant jeunes on peut supposer qu'ils devaient tous être non immunisés contre le virus (susceptibles). Ces cas groupés ont fait l'objet d'une étude épidémiologique publiée dans le BEH du 21 septembre 2010. Voici les nombres de malades observés dans les 9 classes de l'école ainsi que les taux d'attaque (rapport du nombre de cas au nombre d'élèves de la classe). Le taux le plus élevé est de 36% et les autres ne dépassent pas 30%, voire beaucoup moins.

 

 

Classe

Effectif

Cas

Taux d'attaque

CE2/CM1

25

9

36,00%

CE2B

24

7

29,20%

CE2A

23

5

21,70%

CP/CE1

24

5

20,80%

CM1B

26

3

11,50%

CE1A

25

2

8,00%

CM2B

21

1

4,80%

CP 1

24

1

1,70%

CM2A

21

0

0,00%

Total école

213

36

16,90%

 

Notons que la diffusion du virus dans l'école a été attribué à une répétition de chorale pour toute l'école le jeudi après midi du 18 juin, sous le préau alors qu'un enfant déjà malade se trouvait parmi eux et est revenu à l'école  pour la matinée, que l'école a été fermée le 26 juin et que l'enquête a débuté ensuite. Comme la durée d'incubation était très courte (en moyenne 1,5 jours,  voir **) ces actions n'ont  pu avoir d'incidence sur le développement de l'épidémie dans l'école.

Si les modèles mathématiques ne parviennent même pas à modéliser la propagation dans une école ou une classe il faudrait s'interroger sérieusement sur les raisons avant de se lancer dans des modélisations nationales ou mondiales pour le moins prétentieuses et en affolant toute la planète ...

La leçon donnée par le virus pandémique 2009 vaut bien un fromage sans doute !

**Estimations de la durée pour devenir contagieux (temps de génération) et de la durée d'incubation (durée pour avoir des symptômes) pour la grippe pandémique 2009 (doc. OMS déjà cité REH n° 34 du 21 août 2009) :

« Plusieurs groupes du Royaume-Uni et des États-Unis ont présenté des estimations du temps de génération qui étaient assez cohérentes d’un groupe et d’un endroit à l’autre, et ont convenu que le temps de génération moyen pour la grippe pandémique H1N1 2009 était de 2,5 à 3 jours. On a disposé de moins de données concernant la période d’incubation médiane, mais une estimation laisse à penser qu’elle est de 1,4 jour (IC à 95%: 1,0 1,8), ce qui correspond aux souches de virus grippal ayant circulé précédemment. »

 En conséquence, la durée pour devenir contagieux serait au moins une journée plus longue que l'apparition des symptômes pouvant conduire à rester à la maison et s'aliter. D'où une réduction des contaminations par rapport à la situation inverse. La question se pose alors : les nombreux asymptomatiques sont-ils contagieux ?

 

En acceptant R0=1,4 (estimations OMS entre 1,2 et 1,7) et une durée de contagiosité double de celle d'incubation j'ai appliqué le modèle Reed et Frost dans ces conditions à un groupe de 1000 personnes. Avec aucun résistant au départ j'ai obtenu 512 cas soit 51,2% ce qui est encore trop. Avec R0=1,2 j'obtiens 315 cas soit 31,5% qui serait plus acceptable. Mais il faut bien observer que ces R0 sont fabriqués à partir de courbes observées et qu'ils cherchent à reproduire cette courbe en choisissant convenablement le R0 pour cela. Comme leurs modèles donnent beaucoup trop de cas cela les conduit ipso facto à trouver des R0 très faibles comme on le constate ici, trop faibles sans doute.

Pour ma part, je suis convaincu que le R0 associé à une partie des contagieux peut être beaucoup plus grand alors qu'il sera nul ou pratiquement nul pour une autre partie et que les proportions relatives de ces 2 parties ne sont pas constantes au cours du temps en raison de l'alternance des jours chômés et ouvrés, voire des vacances et qu'on ne peut modéliser une telle situation par un R0 homogène et constant.

 

 

 

Modéliser la propagation dans une classe

Il faudrait commencer par cela car je suis convaincu que tant qu'on ne sera pas capable de le faire correctement ce ne sera pas la peine de chercher à modéliser une propagation mondiale...

Dans une classe de 30 élèves on a observé la propagation suivante : en début de semaine un élève contagieux contamine 4 autres élèves. Comme la durée d'incubation est de 1,5 jours, certains ne deviendront pas malades ou contagieux avant de quitter l'école le mardi soir. Trois d'entre-eux tomberont malades le mercredi, jour sans école et ni retourneront  pas le jeudi. Cependant, le quatrième y viendra le jeudi où il contaminera aussi 4 élèves parmi les 26 présents autres que  lui-même. Ces élèves ne deviendront pas contagieux avant d'avoir quitté l'école le vendredi soir. Malades pendant le week end ils ne reviendront pas le lundi et l'épidémie dans la classe s'arrêtera là soit 1+4+4=9 malades en tout sur 30 élèves.

Bien entendu cela n'exclut pas  qu'ils puissent contaminer en famille et que l'épidémie puisse aller ailleurs ou même revenir dans la classe par une autre chaîne issue de celle-ci mais c'est une autre histoire.

Peut-on modéliser cela avec Reed et Frost ? La réponse est oui mais modulo 2 modifications :

 

1- Tenir compte du fait que les malades ne sont plus dans le groupe qui passe de 30 à 26 le jeudi. Donc prendre l'effectif réel au moment de la transmission du virus. Si on raisonne sur un groupe plus large incluant les familles les enfants malades sont toujours dans le groupe alors qu'ils sont à un moment donné dans la classe et à un autre en famille.

2- Introduire un coefficient K gérant la proportion de contaminants effectifs parmi les contagieux potentiels. Ainsi, K vaudra successivement 1 puis 0,25 pour le mercredi  puis 0 quand les contagieux sont en week end.

 

On choisit R0=C=4 avec la condition initiale I0=1  (l'incidence au temps 0).

Au temps 1 le modèle donnera I1=4 :  [1-(1-4/29)^1]x(30-1)=4

Au temps 2  on prend P=30-3-1=26 pour la division de C par P-1  car les 1+3 malades ne sont pas dans la classe. On obtient 30-1-4=25 susceptibles. Avec K=0,25 on obtient  encore 4 cas : [1- (1-4/25)^(0,25x4)]x25=4.

Au temps suivant, avec K=0 on obtiendra  0 quels que soient les effectifs.

La formule de Reed et Frost avec la séquence où K vaut successivement 1, 0,25 et 0 donne exactement l'évolution observée en tenat compte de l'évolution de la taille du groupe. Avec un R0 moyen il serait impossible d'y parvenir. Bien sûr, il faut choisir la séquence pour K mais ce seront les observations épidémiologiques de terrain qui pourront guider ce choix. On peut aussi observer que si les élèves sont 9 heures par jour ensemble 4 jours sur 7 cela fait 21% de la durée de la semaine. Cela peut servir de guide.

 

 

 

COMPLÉMENTS

Ayant fait l'effort de présenter le modèle de Reed et Frost sur ce blog, ce qui n'était pas évident, je vais présenter d'autres prolongements que ceux directement associés au thème défini par le titre.

Voici les résultats obtenus pour P=1000 (taille du groupe) et C=2 en fonction du nombre de résistants quand débute l'épidémie :

 

Résistants

Instant du Pic

Pic

Non susceptibles au pic

Fin épidémie n=

Total des cas

Total non susceptibles

0

9

154,5

492,5

17

797

797

100

15

107

494,2

19

659

759

200

12

65

529,3

22

514

714

300

14

33

500,5

27

358

658

400

19

10

505

37

189

589

 

On constate que le nombre total d'immunisés et de résistants nécessaires pour que l'épidémie s'arrête diminue quand au début de l'épidémie il y a déjà un certain nombre de résistants : avec aucun résistants il faut en moyenne 797 immunisés mais quand il y a 300 résistants il suffira de 358 cas soit 658 immunisés ou résistants au total. Si on admet que cela peut être obtenu par une vaccination il devient possible de montrer l'avantage considérable de celle-ci pour la maîtrise de l'épidémie.

Cependant, l'expérience de la pandémie 2009 a montré que ce n'était pas aussi simple, le vaccin n'étant pas prêt à temps  ni en quantité suffisante. La campagne c'est au contraire déroulée "à chaud". Comme des personnes peuvent être à la fois asymptomatique et contagieuses, elles pourraient se trouver dans les centres de vaccination au milieu de la foule venant se faire vacciner en masse. Quelles en seraient les conséquences ?

Ajoutons que la première façon d'éviter  la grippe est de ne pas être contaminé. C'est d'ailleurs cela qui se produit sans doute assez souvent en pratique, même sans mesures spéciales prises par les autorités,et qui met en échec les modèles proposés jusqu'alors. C'est cela qui m'a permis de proposer une modélisation dans une classe avec une adaptation de  Reed et Frost.

 

 

L'importance des cloisonnements

Avec R0=2 et une population totalement susceptible (aucun résistant au début de l'épidémie) la proportion moyenne de cas avant la disparition de l'épidémie sera 80% sous l'hypothèse d'une propagation aléatoire sur l'ensemble du groupe. C'est évidemment beaucoup trop par rapport à ce qui est généralement observé.

Il paraît évident que l'hypothèse d'une propagation aléatoire sur l'ensemble du groupe n'est réalisée en pratique que sur des groupes de tailles limitées. Une première façon d'apprécier l'importance de cette condition est de supposer la population constituée de 100 groupes de chacun 100 personnes avec une propagation aléatoire au sein de chaque groupe et en supposant que si un groupe est contaminé il contaminera à son tour 2 autres groupes de façon aléatoire : un groupe contamine un autre groupe si une personne du premier contamine au moins une personne du second.

Si l'épidémie débute dans un groupe elle fera 80 victimes dans celui-ci et la propagation de groupe en groupe touchera  en moyenne 80 des 100 groupes, en faisant 80 cas dans chacun, soit 6400 cas au total, soit 64%.

On peut aussi concevoir une organisation de la population en sur-groupes : une école est constituée de classes, un hôpital de services à différents étages etc.

Soit donc une population formée de 100 sur-groupes constitués chacun de 100 groupes, de 100 personnes, soit 1 million de personnes en tout. Avec la même loi de propagation au niveau des sur-groupes (1 sur-groupe atteint contaminera 2 sur-groupes) la proportion sera 80% à la puissance 3 soit 51,2%.

Sans chercher à faire "réaliste", ceci suggère l'importance des emboitements et des structures qui cloisonnent les échanges. Même si des contacts se produisent aussi dans les transports et même si le virus est présent dans les fosses nasales ou le pharynx il faut aussi une projection par une toux, un éternuement, une parole forte, un chant ...

 

Modélisation par systèmes différentiels

Bien que peu satisfaisant ce procédé est encore très fréquemment présenté voire utilisé même quand la durée de contagion est différente de celle de l'incubation, circonstance où le modèle est mis en échec pour la raison suivante :

Les équations différentielles utilisées étant à coefficients constants, la proportion de contagieux qui guérissent à l'instant t va être proportionnelle aux nombres de contagieux. Si la durée de la contagion est 3 fois celle de l'incubation on prendra 1/3. Mais pendant la phase croissante de l'épidémie le nombre de nouveaux malades est très supérieur au nombre des plus anciens, aussi la proportion de ceux qui guérissent parmi les malades en cours est nettement inférieure à 1/3. Elle atteint à peu près cette valeur 1/3 au moment du pic pour croître ensuite pendant la phase décroissante de l'épidémie car alors ceux qui guérissent sont beaucoup plus nombreux que les nouveaux malades. Cette proportion peut alors dépasser 0,45.

Dans ces conditions on comprend aisément que la répartition des cas au cours du temps sera faussée ainsi que le moment du pic et son amplitude comme j'ai pu le mettre en évidence.

Le théorème du seuil

Avec les systèmes différentiels on établit le théorème du seuil indiquant le niveau d'immunisation nécessaire en fonction de R0 pour que l'épidémie ne se développe pas. On trouve 1-1/R0. Mais avec le modèle de Reed et Frost on trouve une valeur plus faible : [1-1/R0]x[1-1/P] où P est la taille de la population concernée. Cela a peu d'importance si P est grand mais comme les hypothèses de validité du modèle de base sont ''une transmission aléatoire sur l'ensemble du groupe'' cela exige en pratique des groupes de petites tailles comme une classe d'élèves, pas même une école. Ce n'est alors pas négligeable.

Imaginons 100 classes de 20 élèves avec R0=2. Si on regroupe ces 2000 personnes le seuil sera 0,5x(1-1/2000) soit pratiquement 50%. Mais si on remarque qu'il faut et suffit que l'épidémie ne puisse s'installer dans aucune des 100 classes, on aura 0,5x[1-1/20]=47,5% bien répartis sur les 100 classes. Imaginons encore que 50 des 100 classes soient immunisées à 100% et aucune des 50 autres, cela fera 50% d'immunisés en tout MAIS l'épidémie pourra malgré tout se développer parmi les 1000 élèves des 50 classes non immunisées.

D'une manière générale il ne suffira pas qu'il y ait 50% d'immunisés, il faut aussi qu'ils soient bien répartis. Mais comme cette répartition portera alors, la plupart du temps, sur de petits groupes, la correction peut ne pas être négligeable.

Exemple

Avec P=20, C=2 et une durée de contagion égale à 2 soit R0=2x2=4. 1-1/R0=75% qui, multiplié par 1-1/20 donne 71,25% qui donne le seuil d'immunité à atteindre sur un ensemble de classes de 20 élèves et non pas 75% comme donné habituellement.

Modèles  SIR et SEIR

Les modèles dits SIR et SEIR (Susceptibles, Exposés (c'est à dire en incubation), Infectés (contagieux), Résistants  (guéris) ) reposent sur au moins 2 hypothèses :

1- Le nombre de nouveaux contaminés sera proportionnel à la fois au nombre de contagieux et de susceptibles.

2- Le nombre de guéris sera proportionnel au nombre de malades.

Les "exposés" s'introduisent quand on fragmente la période d'incubation qui cesse alors d'être l'unité de temps.

Avec le modèle Reed et Frost ces 2 hypothèses sont non satisfaites comme il est facile de le montrer. C'est ce qui fait tout l'intérêt du modèle Reed et Frost car en pratique ces 2 hypothèses ne sont certainement pas du tout satisfaites.

De plus, avec Reed et Frost, les cases "Exposés" et "Guéris"  deviennent inutiles car les nombres d'exposés et de guéris n'interviennent que par leur somme elle-même ajoutée au nombre d'infectés (contagieux) pour calculer le nombre de susceptibles qui est en fait :

Susceptibles = population totale - contaminés - résistants (naturels ou après vaccination)

Les contaminés se déclinent au présent (les contagieux), au passé (les guéris) et au futur (les exposés  qui sont ceux en incubation) mais ces distinguos n'interviennent pas dans la modélisation par Reed et Frost.

On peut aisément illustrer la problématique des modèles par systèmes différentiels quand la durée de la contagion est supérieure à celle de l'incubation :

Rinçage d'un bassin

On envoie 3 litres d'eau à la minute dans un bassin et il s'en écoule 1 litre par minute. La première goutte d'eau entre dans le bassin au temps zéro pour en ressortir aussitôt. La dernière goutte du premier litre entre au bout de 20 secondes pour en sortir au bout d'une minute. Elle sera donc resté 40 secondes dans le bassin. La dernière goutte du troisième litre entre au bout d'une minute pour en sortir après 3 minutes. Elle y sera resté 2 minutes. Le temps passé dans le bassin pour les gouttes correspond à la durée de la contagion pour les malades. Si elle n'est pas du tout uniforme il sera impossible de la rendre égale pour tous les contagieux.

Ainsi, avec un modèle par systèmes différentiels type SIR et une durée de contagion voulue  égale à 3 fois celle de l'incubation, des contagieux peuvent le rester pendant 20 périodes d'incubation comme j'ai pu le mettre en évidence sur une publication internet qui a été retirée après que j'en ai eu informé les auteurs...

Les auteurs avaient traduit l'hypothèse d'une durée triple pour la contagion par la guérison du tiers des malades en cours, soit 3 fois moins de "débit" à la sortie (la guérison) qu'à l'entrée (quand on devient contagieux).

En fait, sous les hypothèses 1 et 2 énoncées plus haut il est impossible d'avoir une durée de contagion uniforme pour tous. Ces modèles sont donc incohérents. Ils ne seraient acceptables, de ce point de vue, que si la durée de contagion et d'incubation étaient égales. Malgré cela, les hypothèses 1 et 2 restent  sans doute non réalisées en pratique.

Les modèles par systèmes différentiels à la poubelle ?

C'est ce qu'il faudrait avoir le courage de faire pour ne les garder qu'à titre pédagogique et historique dans le but de montrer pourquoi ils ne sont pas du tout satisfaisants. On peut les remplacer plus qu'avantageusement par les modèles Reed et Frost remarquablement adaptables, permettant une traduction immédiate de nombreuses hypothèses et dont la résolution est aisée à programmer.

Mais cette commodité des modèles Reed et Frost joue en leur défaveur car ils ne sont pas assez valorisant : un système différentiel ça impressionne, aussi ça pose son homme ! "Voyez, nous les épidémiologistes, nous sommes capables d'utiliser des systèmes différentiels ! " Pour les enseignants au lycée c'est un moyen de valoriser leur enseignement des mathématiques : "vous vous rendez compte, avec ces équations on peut suivre l'évolution des épidémies de grippe et autres, impressionnant ! Mais c'est difficile donc il faut travailler."

Avec Reed et Frost c'est beaucoup plus facile mais en discontinu, ce qui est moins prisé qu'en continu. On a un système de suites qui, comme me le disait un collègue, fait ringuard par rapport à un système différentiel ... La nature humaine ne change pas ...

 

Mise en équations différentielles 

Par hypothèse les modélisateurs supposent que le nombre de nouveaux infectés (contagieux) apparus entre l'instant t et l'instant t+h est proportionnel à la fois au nombres I(t) d'infectés et de susceptibles au temps t, soit : I(t+h)-I(t)=f(t,h)S(t)I(t). On peut expliciter la fonction f(t,h=[I(t+h)-I(t)]/S(t)I(t) qui apparaît comme une fonction des 2 variables indépendantes t et h. En utilisant le fait que f(t,0)=0 on peut écrire : [I(t+h)-I(t)]/h=S(t)I(t)[f(t,h)-f(t,0)]/h. A la limite quand h tend vers 0 on obtient la dérivée de I(t) en t ainsi que la dérivée partielle de f par rapport à h au point (t,0). Soit dI/dt=[∂f(t,0)/∂h]S(t)I(t). Les modélisateurs supposent que la valeur au point (t,0) de la dérivée partielle ∂f(t,0)/∂h est indépendante de t, ce qui permet une mise en équation et sa résolution au moins numérique. Mais personne ne vérifie que les solutions trouvées satisfont aux hypothèses utilisées pour y parvenir.

D'ailleurs ils n'écrivent pas tout cela, sinon ils verraient sans doute le problème. Ils disent que sur une durée très courte h l'accroissement est proportionnel au produit SI ce qui revient à admettre que f(t,h) est seulement fonction de h et non de t. On a donc seulement une fonction de la variable h qui admet en 0 une dérivée df(0)/dt qui est un nombre. Difficile de parler de ''théorème'' dans ces conditions ...

La formule de Hamer qui préside à cette mise en équation donne CIS/N pour le nombre de nouveaux  contagieux engendrés par les I contagieux actifs, N étant le nombre total d'individus et C le nombre de vrais contacts. Si on écrit cela sous la forme CI/NxS/NxN on met en évidence CI/N et S/N qui sont les probabilités pour un individu d'être contaminé et d'être susceptible. Leur produit est interprété comme étant la probabilité d'être à la fois contaminé et susceptible, les 2 conditions pour devenir contagieux. La multiplication par N de cette probabilité donne alors le nombre moyen de nouveaux contagieux. MAIS, cette écriture suppose que les événements être contaminé et être susceptible sont 2 événements indépendants. Ou encore que les événements être contaminé et être immunisé sont indépendants. Quand on veut modéliser l'évolution autonome de l'épidémie (sans immunisations autres que celles provoquées par la maladie) les immunisés sont les anciens malades. Cela revient à dire que les contaminations doivent se faire de façon aléatoire dans le groupe.

La formule de Hamer résulte de celle de Reed et Frost quand C/N et I sont faibles. La quantité 1-(1-C/N)^I est alors proche de CI/N.

 En Physique, les mises en équations se font sur le même principe mais, pour la décharge du condensateur par exemple, les charges électriques circulent avec une échelle de temps et une succession des charges qui n'a rien à voir avec celles de l'apparition de nouveaux malades. Aussi cela est plus acceptable.


On peut consulter "Modélisation mathématique en épidémiologie"

Page 162 :
« Dans un cadre déterministe, les équations différentielles constituent l’outil mathématique idéal pour décrire des modèles en compartiments. »

Ansi que : http://www.annales.org/re/2008/re51/Boelle.pdf 

Un diaporama d'Antoine Flahault :

http://www.college-de-france.fr/media/mic_mal/UPL13576_S_minaire_Antoine_Flahault.PDF

Ou encore :

http://graduateschool.agroparistech.fr/site.php?id=59&fileid=129

Modèles pour les élèves :

[1]  http://media.eduscol.education.fr/file/MPS /23/5/LyceeGT_Ressources_2_Exploration_MPS_5-3_epidemiologie_152235.pdf

 

Publicité
Publicité
Commentaires
La Question des Vaccins
Publicité
Derniers commentaires
Archives
La Question  des Vaccins
Publicité