Préambule

Cette application, comme l’ensemble de nos rapports, est à visée académique, fruit d’un travail de recherche fondamentale indépendant des autorités compétentes en matière de santé. Comme précisé ci-dessous, les simulations réalisées reposent sur des hypothèses volontairement simplifiées et plusieurs des valeurs utilisées sont mal documentées. En matière de santé publique et pour toute question, nous recommandons de consulter et suivre les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus

Pourquoi cette application ?

Le but de cette application est de permettre de visualiser les effets de mesures de contrôle de santé publique limitant la propagation du virus SARS-CoV-2 sur le déroulement de l’épidémie de COVID-19. Ces prévisions sont à prendre avec beaucoup de précautions et, avant tout, comme des indications qualitatives.

Ce modèle est simple et peu réaliste pour une échelle nationale. C’est pourquoi nous avons permis de visualiser l’épidémie à une échelle départementale, pour laquelle il est un peu plus réaliste. L’application permet de faire des prévisions sur le temps court mais aussi sur le temps long. À l’instar de la météorologie, plus les prévisions sont lointaines, plus elles sont incertaines (nous ne disposons pour le moment d’aucun recul sur la durée de l’immunité des personnes guéries).

Enfin, nous avons tenté de calibrer les modèles de notre mieux en fonction des données disponibles au moment de la rédaction de ce rapport. Toutefois, peu de données utiles à la paramétrisation du modèle sont disponibles pour la France. Ce manque a donc dû être palié par des transpositions de données obtenues dans d’autres pays, des approximations simplificatrices ou des choix opérées par d’autres travaux de modélisation.

Cette application est accompagnée d’un rapport qui décrit quelques propriétés et résultats de base.

Limites des prévisions (à lire attentivement)

Cette application repose sur un modèle mathématique qui, comme tout modèle, est une simplification de la réalité. Ce modèle est décrit plus avant dans l’onglet “Modèle” mais parmi ses hypothèses fortes on peut citer :

  • l’absence de structure de contact explicite entre les individus et l’absence de structure spatiale,

  • l’absence de précision des mesures de contrôle de santé publique implémentées : toutes les options (quarantaine des cas confirmés, adoption des gestes barrières, distanciation sociale : fermeture des écoles et universités, interdiction des rassemblements…) sont agglomérées en une réduction du taux de contact,

  • l’absence de transmission environnementale par les fomites,

  • l’immunité des personnes guéries confère une protection parfaite et à vie contre les ré-infections (point sur lequel nous ne pouvons avoir de recul pour le moment),

  • l’incertitude des paramètres : certaines données biologiques (temps d’incubation, \(\mathcal{R}_0\), durée de contagiosité) sont relativement bien connues mais dépendent pour beaucoup d’études conduites en Chine, certaines données sanitaires (temps entre l’infection et l’hospitalisation, temps entre l’hospitalisation et le décès) sont elles pour l’instant mal connues pour la France,

  • la létalité est supposé constant alors qu’en pratique il varie potentiellement en fonction du temps en dépendant du nombre de personnes infectées à un moment donné (si les hôpitaux sont saturés, la mortalité liée au COVID-19 et la mortalité naturelle augmentent).

Sources et remerciements

  • Le groupe de modélisation de l’équipe ETE (Laboratoire MIVEGEC, CNRS, IRD, Université de Montpellier) est composée de Samuel Alizon, Thomas Bénéteau, Marc Choisy, Gonché Danesh, Ramsès Djidjou-Demasse, Baptiste Elie, Yannis Michalakis, Bastien Reyné, Quentin Richard, Christian Selinger, Mircea T. Sofonea.

  • Les auteurs remercient la plateforme South Green de l’IRD de Montpellier pour l’hébergement de cette application (plus de détails sur bioinfo.ird.fr).

  • Ce travail n’a reçu aucun financement spécifique à ce jour et repose sur la bonne volonté des auteurs (confinés) qui ont mis de coté leurs recherches.

  • Contribution à ce travail :

    • conception du travail : ensemble de l’équipe

    • réalisation du modèle et du code : MTS avec l’aide de BE et BR

    • interface shiny : BR avec l’aide de MTS

    • rédaction : SA, BR et MTS

    • validation : ensemble de l’équipe

  • contact :

  • site web : covid-ete.ouvaton.org

  • Licence Creative Commons
    Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.

Généralités sur la modélisation

Avant d’aborder les spécificités du modèle ici introduit, il est important de rappeler l’utilité et la portée de la modélisation, qu’elle soit mathématique ou computationnelle. Un modèle est une représentation simplifiée d’un phénomène réel ayant pour objectifs :

  1. de rendre compréhensible ce dernier en isolant ses composantes essentielles ainsi que les interactions qui en régissent la dynamique (p.ex. les diagrammes compartimentés),

  2. d’identifier des observables, des descripteurs quantitatifs capables de résumer l’information sur l’état du phénomène (p.ex. le nombre de reproduction de base \(\mathcal{R}_{0}\)),

  3. de mettre en évidence des comportements non triviaux (p.ex. rétro-contrôles/feedbacks, mutlti-stabilité, hystérèse) du système étudié, qui échappent au raisonnement intuitif du fait de la non-linéarité et de la multi-dimensionnalité des phénomènes étudiés.

L’ambition première d’un modèle n’est donc pas de prédire l’avenir, mais d’éclairer notre compréhension d’un phénomène dynamique, en fournissant un cadre de raisonnement adapté, quantifié, manipulable et falsifiable, là où l’intrication est un obstacle à une analyse intuitive et verbale rigoureuse. En particulier, un modèle peut être utilisé comme validation logique (proof-of-concept) d’une conjecture : si un système simplifié comme celui du modèle est capable d’un tel comportement, alors il en est de même pour le phénomène réel dont il dérive, à conditions que les hypothèses de travail soient justifiées. L’ajustement du modèle aux données empiriques et l’analyse de sensibilité sont deux méthodes qui permettent d’apprécier le potentiel explicatif d’un modèle.

Modèle épidémique du COVID-19 en temps discret

Le modèle sur lequel repose cette application est un système dynamique déterministe compartimenté. Contrairement à la majorité des modèles déterministes couramment employés en épidémiologie, celui-ci présente la particularité de se dérouler en temps discret, avec un pas de temps fixe égal à une journée. Ce choix implique un formalisme de suites numériques, moins compact et moins intuitif que celui des équations différentielles ordinaires, à l’image de celles régissant la dynamique des modèles en temps continu que notre équipe a dévéloppé dans un précédent rapport.

Plus proche d’une écriture algorithmique, ce modèle en temps discret présente un l’avantage essentiel d’implémenter la mémoire des processus. En effet, les modèles en temps continu usuels reposent sur une hypothèse forte concernant la survenue des événéments de transitions entre compartiments : celle d’une distribution exponentielle des temps d’attente, la seule loi – avec la loi géométrique, son analogue en temps discret – pour laquelle la probabilité du temps restant est indépendante du temps déjà écoulé.

Si cette simplification n’altère généralement pas les propriétés qualitatives du modèle sur le temps long (comportement asymptotique), elle devient problématique lorsque l’étude du phénomène porte sur le temps court (régime transitoire), que l’on souhaite apprécier l’état du système à une date donnée, que des modifications brutales du système peuvent survenir et bien sûr lorsque le futur ne dépend pas que du présent, mais aussi du passé. Ainsi, dans le cas du COVID-19, il est très rare que les symptômes se déclarent le lendemain de la contamination. Au contraire, les signes cliniques apparaissent majoritairement au tournant de la semaine qui suit cette dernière. Ne pas tenir compte d’une telle donnée affecterait la temporalité de court terme des dynamiques simulées.

Bien qu’il existe des corrections implémentables aux modèles d’équations différentielles ordinaires pour faire face à chacune de ces situations précédemment mentionnées (délais, impulsions, équations non autonomes), le passage en temps discret permet d’aisément cumuler l’ensemble de ces options, tout en se rapprochant du format même des données collectées, surveillées et communiquées au cours des épidémies comme celle du COVID-19, qui par nature sont rythmées par la succession des jours.

Ce modèle est structuré en compartiments, qui représentent les états clinico-épidémiologiques dans lesquels les individus (sensibles, infectés, hospitalisés, guéris, décédés) peuvent se trouver. Les transitions entre ces états suivent des lois de probabilités, basées sur les données existantes ou, à défaut, sur des estimations vraisembables.

Structure

Notre modèle considère une population initialement sensible sous-divisée en deux groupes (\(S=S_1+S_2\)) : les individus âgés de moins de 50 ans (\(i=1\)) et ceux aĝés de 50 ans et plus (\(i=2\)). Aucun autre type d’hétérogénéité n’est pris en compte.

Le choix de cet âge charnière est justifié par les observations suivantes :

  1. la létalité du COVID-19 augmente avec l’âge (Verity et al. 2020),

  2. la proportion-seuil de l’immunité collective est d’environ 60 % (voir Rapport n°2 pour plus de précisions sur cette notion et son calcul),

  3. la proportion de la population française âgée de moins de 50 est environ égale à 60 % (INSEE 2020).

Ainsi, ce modèle permet d’explorer une hypothèse de contrôle épidémique stratifié en âge parmi les plus simples à envisager : celle de mesures de contrôle différentielles selon deux groupes d’âges, dont le premier représente à la fois le risque minimal de complications et la proportion suffisante à l’immunité collective. Nous insistons toutefois sur le fait que cette disposition du modèle ne constitue en aucun cas une suggestion de mesure de contrôle puisque des interventions de santé publique bien plus fines peuvent s’avérer être des options plus judicieuses, et qu’une modélisation isolée ne saurait constituer une méthode d’évaluation des mesures de contrôle. Encore une fois, l’intérêt de cette implémentation réside dans la mise en évidence des effets qualitatifs du changement de paramètres (taux de contact) au cours du temps sur la dynamique épidémiologique.

Chaque jour, un hôte sensible peut être infecté avec une probabilité qui dépend de la force de l’infection et notée \(\Lambda_i\). Notez donc que selon l’âge, on peut être plus ou moins susceptible d’être infecté⋅e.

Une fraction \(1-\theta_i\) de ces hôtes développent une infection non critique (c’est-à-dire qui ne nécessiteront pas de réanimation). Ces infections sont notées \(J_{i,k}\)\(i\) correspond toujours à la classe d’âge et \(k\) correspond au nombre de jours écoulés depuis la contamination. On commence ainsi par la classe \(J_{i,1}\), puis le lendemain on passe à \(J_{i,2}\) et ainsi de suite jusqu’au jour \(g\) correspondant à la fin de contagiosité pour 99% des infections non critiques. De \(J_{g,i}\), on passe alors vers un état immunisé noté \(R_i\). Un aspect important du modèle est que la contagiosité des personnes infectées dépend du temps écoulé depuis la contamination. Ainsi, les \(J_{i,1}\) ne contribuent quasiment pas à la circulation du virus car statistiquement les données épidémiologiques n’ont pas mis en évidence de transmission dès le premier jour d’infection.

La fraction restante des infections, \(\theta_i\), correspond à des cas critiques. Ils sont notés \(Y_{i,k}\), suivant le même indiçage que les infections peu sévères, \(k\) étant le nombre de jours d’infection écoulés et \(i\) la classe d’âge.

Les infections critiques conduisent à une hospitalisation en réanimation. Celle-ci se réalise avec une probabilité \(\eta_k\). Ainsi, plus l’infection sévère progresse, plus le risque d’être hospitalisé augmente. Si la durée maximale d’une infection sévère (\(h\) jours) est atteinte, l’hospitalisation a lieu avec une probabilité 1. L’hospitalisation se traduit vers le passage à un compartiment \(H_{i,k}\) correspondant au premier jour d’hospitalisation. Chaque jour \(k\), les personnes hospitalisées ont une probabilité \(\upsilon_k\) de quitter le compartiment \(H_{j,i}\), ce qui signifie que la personne est décédée (avec une probabilité \(\mu_i\)) ou qu’elle en a guéri (avec une probabilité \(1-\mu_i\)). Cette sortie du compartiment a lieu avec une probabilité 1 au jour \(u\). En cas de décès, la personne passe dans le compartiment \(D_i\) et en cas de guérison elle passe dans le compartiment immunisé (\(R_i\)).



Diagramme de flux synthétisant la structure du modèle. Les compartiments qualitativement équivalents sur le plan épidémiologique partagent la même couleur. Les compartiments cliniquement équivalents partagent la même lettre. Par souci de concision, seul un des deux groupes est ici représenté (groupe \(i=1,2\)). Les flèches bleues correspondent à des transitions survenant de façon certaine chaque jour. La probabilité journalière de transition selon une flèche noire est indiquée au-dessus. Par souci de lisibilité, les probabilités des transitions issues de bifurcation ne sont pas indiquées mais se déduisent par complémentarité à \(1\) de l’alternative. Pour rappel : \(S\equiv\) sensibles, \(J\equiv\) infectés non critiques, \(Y\equiv\) infectés critiques, \(H\equiv\) hospitalisés en réanimation, \(R\equiv\) guéris immunisés, \(D\equiv\) décédés.

Paramétrisation

La force de l’infection à laquelle un individu sensible du groupe \(i\) est exposé à la date \(t\) est la probabilité journalière d’être infectée

\[\begin{align} \Lambda_{i}\left(t\right)=\overline{I}\left(t\right)\Big/\left(\frac{S_{0}}{c_{i}\left(t\right)\mathcal{R}_{0}}+\overline{I}\left(t\right)\right) \end{align}\]

\(\overline{I}\left(t\right)\) est la densité d’individus contagieux dans la communauté (i.e. extra-hospitalière), pondérée par le degré de distanciation sociale de chaque groupe (\(c_{i}\left(t\right)\)) : allant du simple geste barrière au confinement total) ainsi que le degré de contagiosité correspondant au temps écoulé depuis le début de l’infection \(\zeta_k\) :

\[\begin{align} \overline{I}\left(t\right)=\underset{i}{\sum}c_{i}\underset{k}{\sum}\zeta_{k}\left(J_{i,k}+Y_{i,k}\right) \end{align}\]

Noter que \(\Lambda_{i}\) étant une probabilité, elle est nécessairement bornée par 1, d’où son expression (\(\Lambda_{i}\underset{\overline{I}\rightarrow\infty}{\longrightarrow}1\)). Enfin, l’ensemble des paramètres essentiels au modèle est détaillé dans le tableau ci-dessous.

Notation Description Valeurs Loi Référence
\(S_{0}\) taille de la population française \(67\times10^{6}\) fixe INSEE 2020
\(\mathcal{R}_0\) nombre de reproduction de base \(\left[2;4\right]\) fixe (utilisateur) Rapport n°1
\(c_{i}\left(t\right)\) degré de distanciation sociale du groupe \(i\) à la date \(t\) \(\left[0;1\right]\) arbitraire (utilisateur) /
\(\zeta_{k}\) degré de contagiosité au jour \(k\) de l’infection \(\left[0;1\right]\) \(\mathrm{Weibull\left(2.24,5.42\right)}\) tronquée Nishiura et al. 2020
\(\mu_{i}\) proportion de décès en réanimation 56 % fixe Rapport Santé Publique France 2020-03-15
\(\theta_{i}\) proportion de cas critiques \(1.8\times\mathrm{IFR}_i\) fixe Rapport Santé Publique France 2020-03-15
\(\mathrm{IFR}_i\) létalité effective du groupe \(i\) \(\left[0;0.1\right]\) fixe Ferguson et al. 2020, INSEE 2020
\(\eta_k\) probabilité journalière d’hospitalisation au jour \(k\) de l’infection \(\left[0;1\right]\) somme tronquée de \(\mathrm{Weibull\left(1.77,6.52\right)}\) et \(\mathrm{Weibull\left(0.766,2.90\right)}\) Linton et al. 2020
\(\upsilon_k\) probabilité journalière de décès au jour \(k\) de l’admission en réanimation \(\left[0;1\right]\) \(\mathrm{Weibull\left(2,10\right)}\) tronquée Linton et al. 2020

Paramètres

Mesures de contrôle

Contrôle

Préambule

Cet outil est avant tout à destination académique et à visualiser des effets qualitatifs. Il repose sur des hypothèses simplistes et plusieurs valeurs de paramètres demeurent incertaines.

Paramètres et onglets

Le panneau Paramètres sur la gauche permet de choisir l’échelle spatiale de l’épidémie (France ou un des départements) et attribuer la valeur de caractéristiques variables du modèle. À droite de l’onglet Instructions, se trouvent trois modalités de visualier une même simulation :

  • Cumul présente les nombres totaux d’infections et de décès au cours du temps (aussi appelées incidence cumulées),

  • Incidence présente le nombre de nouveau cas chaque jour (aussi appelé incidence journalière),

  • Prévalence présente le nombres de personnes légèrement inféctés et en réanimation à un instant donné.

Options générales

Département

Par défaut, la simulation s’applique à la France entière, mais, sans structure spatiale, le modèle y est peu adapté. Une visualisation par département est donc proposée.

Cas importés

À ce jour, nous n’avons pas réalisé d’estimation de paramètres pour cette application. Il revient donc à l’utilisateur de paramétrer l’initiation de l’épidémie, dépendante des cas importés dans le département (ou le pays) entre le 20 janvier et le 20 février. En première approche, cela revient à ajuster, via la visualisation de l’onglet Cumul, le nombre de cas importés tel que la donnée de mortalité cumulée soit proche de la simulation, ou à défaut parallèle. En pratique, ce nombre est généralement faible.

Nombre de reproduction de base

Nos calculs placent le nombre de reproduction de base (\(\mathcal{R}_0\)) aux alentours de 3. Sa valeur reste néanmoins paramétrable, en particulier dans le but d’ajuster la simulation aux données de nombre de décès (et en outre apprécier l’effet du nombre de reproduction sur l’épidémie).

Nombre de jours

Ce réglage n’est qu’un paramètre graphique. Il ne sert qu’à déterminer la date jusqu’à laquelle l’utilisateur souhaite visualiser les trajectoires. Plus ce nombre est élevé, moins les prévisions du modèle sont fiables.

Stratégies de contrôle

Une des originalités de cette application tient au fait qu’elle permet de visualiser l’effet de différentes mesures de contrôle en santé publique qui varient dans le temps. Ces interventions dépendent de leur durée, de leur intensité, et elles peuvent différer selon les groupes. Ces propriétés sont réglées à l’aide des paramètres détaillés ci-après.

Âge seuil

Les mesures de contrôle peuvent s’appliquer différement en fonction de son âge. Ce réglage permet fixe l’âge seuil qui sépare les deux groupes. Il est mis par défaut à 50 ans pour des raisons détaillées dans la page de documentation Modèle qui accompagne cette application.

Nombre de périodes de contrôle

Les mesures de contrôle peuvent varier dans le temps et pour chaque changement il faut définir une nouvelle période. Nous avons pris par défaut 4 périodes qui correspondent respectivement

  • à la phase pré-confinement (contrôle faible),
  • au confinement national qui a débuté le 16 mars,
  • aux mesures post-confinement,
  • à la levée de toutes les mesures.

Des stratégies plus fines peuvent être explorées : par exemple alterner les phases de confinements strict et modéré. Attention, rajouter une période de contrôle implique de redéfinir les valeurs de contrôle pour toutes les périodes.

Dates des périodes de contrôle

Chaque période de contrôle est définie par une date de début et une date de fin. Note importante : l’utilisateur doit veiller à ce que les périodes ne se chevauchent pas dans le temps. Cette possibilité est toutefois laissée, dans le cas où des mesures de nature différentes seraient cumulées, de façon multiplicative. La cohérence des périodes de contrôles peut être vérifiée par leur intensité, représentée en tirets gris sur les onglets Cumuls, Incidence et Prévalence.

Intensité des mesures de contrôle

Dans notre modèle, nous n’avons pas détaillé les différentes mesures de contrôles. Limitation des contacts, auto-isolement des personnes infectées, fermeture des écoles, confinement, toutes sont supposées diminuer la propagation de l’épidémie en diminuant la composante de contact du \(\mathcal{R}_0\). L’efficacité d’une mesure de contrôle peut donc être vue commune la fraction restante du \(\mathcal{R}_0\) suite à l’application de la mesure (plus une mesure est efficace, plus cette fraction est proche de \(0\) tandis qu’en absence de contrôle, cette fraction vaut \(1\)).
Exemple : une efficacité de contrôle de \(0.25\), correspond virtuellement à une division par \(4\) du taux de contact et donc du \(\mathcal{R}_0\). Pour chacune des périodes de contrôle, l’efficacité peut être fixée indépendamment pour chacun des deux groupes. Elles sont représentées par les courbes grisées tiretées en escaliers.
À noter que l’intensité des mesures de contrôle n’est que très difficilement quantifiable a priori, cette intensité peut donc être fixé selon l’appréciation de chacun.

Données

Sur les trois onglets Cumuls, Incidence et Prévalence, nous représentons — à chaque fois que cela nous semble pertinent — les données réelles, représentées par des pointillés.
Ces données émanent de Santé Publique France et sont consolidées par le projet OpenCOVID19 France.

Notons que pour l’onglet Incidence, les données sont lissées avec une moyenne mobile d’ordre 2 en utilisant la fonction \(\texttt{forecast::ma}\).



Licence Creative Commons
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.