Un modèle simple pour la pandémie de coronavirus

Prenez une boîte de Pétri, remplissez-la de gélose, mettez-y une goutte d’échantillon de bactéries, fermez-la et mettez-la dans un endroit chaud. Les bactéries se développeront de manière explosive au début, mais leur croissance ralentira ensuite et finira par s’arrêter complètement une fois que les bactéries auront consommé tous les nutriments possible. Mathématiquement, ce processus peut être caractérisé de manière assez précise grâce à la fonction logistique.


Fonction logistique (Verhulst) — Wikipédia


La fonction logistique fonctionne également bien pour la caractérisation des pandémies, puisque le processus sous-jacent est similaire. Le taux de croissance des bactéries dépend du nombre de bactéries et ralentit lorsque les nutriments s’épuisent ; le taux de propagation de l’infection dépend du nombre d’individus infectés et ralentit lorsque le nombre d’individus restant à infecter diminue.


f(t) = K\frac{1}{1+ae^{-rt}}


Les modèles mathématiques peuvent être arbitrairement compliqués et, en conséquence immédiate, arbitrairement erronés. Il est possible d’adapter un polynôme à presque toutes les données en y ajoutant simplement suffisamment de termes, mais la valeur prédictive d’un tel exercice est pratiquement nulle. Le modèle logistique est simple. Il n’utilise que trois paramètres : le point médian, le maximum et le taux de croissance. Et il modélise des phénomènes physiques réels qui sont omniprésents dans la nature : la croissance exponentielle et la saturation exponentielle.

Pour modéliser la pandémie de coronavirus, nous avons dû ajouter un quatrième paramètre : un petit décalage. En effet, les données chinoises, pour quelque raison que ce soit, sont difficiles à traiter dans le cadre du modèle mondial. À la mi-février, le coronavirus a fait un bond en dehors des boîtes de Pétri, si vous voulez. Après cela, la boîte de Pétri est devenue la planète entière.
Une fois que nous l’ajustons pour les données chinoises, le modèle produit un excellent ajustement avec un écart-type de 2 %. Les données que nous avons choisi d’analyser sont le nombre de décès dus aux coronavirus, tel que rapporté par worldometers.info. Le nombre de décès du aux coronavirus est bien plus précis que toutes les autres statistiques. Le nombre d’individus infectés dépend de la précision du test et du nombre d’individus testés. Le nombre de cas graves dépend de mesures de la gravité qui peuvent varier et avoir une composante subjective. Et bien qu’il y ait une chance non nulle qu’un certificat de décès mentionnant COVID-19 comme cause du décès soit également erroné, de telles erreurs, et quelle que soit l’interaction des facteurs qui y donnent lieu, ne semblent pas affecter la précision de notre exercice d’ajustement des courbes.
Voici une représentation graphique de notre modèle (en rouge) et des données sur les décès dus aux coronavirus (en bleu).




À l’exception des décès dus aux coronavirus chinois (que nous ignorons en introduisant un décalage de 2770 décès), les données et le modèle diffèrent de moins que l’épaisseur de la ligne. Bien que cela soit visuellement satisfaisant, il peut y avoir certaines tendances non évidentes dans les données que le modèle ne contient pas, que nous pouvons rechercher en examinant les résidus entre les données et notre courbe :





Si la fonction logistique ne saisissait pas tout ce qui se passe avec la pandémie de coronavirus, alors nous verrions une certaine tendance dans les résidus : les données s’écarteraient du modèle de manière systématique. Cependant, tout ce que nous voyons ici, c’est un tas de bruits aléatoires dont la moyenne est calculée dans le temps.

Une autre méthode pour valider notre modèle est l’analyse de régression. Elle montre que la linéarité est excellente.




Une façon utile d’examiner les données est de tracer les décès à l’échelle mondiale. Dans le graphique ci-dessous, les barres bleues représentent les décès dus à la COVID-19 tels qu’ils ont été déclarés et la ligne rouge en pointillés représente notre modèle.





Nous pouvons voir ici où notre modèle prévoit que le point médian de la pandémie se produira. Il est actuellement fixé au 8 avril. Cependant, comme les données sont arrivées à mi-parcours, le point médian a dérivé vers l’avant. Le 31 mars, il était fixé au 4 avril. En d’autres termes, sur 15 jours, il a dérivé de 4 jours. Nous ne pouvons que deviner pourquoi. Il y a peut-être un décalage dans la déclaration des décès dus au  COVID-19. Ou peut-être que la taille de la planète joue un rôle et que, malgré les voyages aériens quasi instantanés, la propagation géographique du virus prend un temps non négligeable. Mais ce ne sont que des suppositions. Il suffit de dire que si la dérive reste constante, alors à la mi-mai, le point médian aura été franchi vers le 16 avril.

À mesure que le point médian dérive, la limite supérieure dérive également. Il y a une semaine, le nombre total de décès par COVID-19 était proche de 140000, mais il approche maintenant les 170000. Cette dérive rend dangereuse toute prévision exacte basée sur notre modèle. Le nombre final de décès par COVID-19 pourrait être jusqu’à 50% plus élevé. Il se peut très bien que les données actuelles, et donc le modèle, ne tiennent pas compte de la future propagation géographique du virus dans des zones aux ressources médicales limitées, où les cas de COVID-19 ne seront ni diagnostiqués ni signalés.

Quant aux nombreux pays qui luttent actuellement activement contre le coronavirus en fermant le trafic aérien, en imposant des couvre-feux et des restrictions de voyage, en forçant les gens à rester chez eux, en exigeant que les gens portent des masques faciaux et se tiennent à distance en public, nous pouvons peut-être supposer que pour eux, les données sur les décès dus à la COVID-19 sont à la fois précises et opportunes. Sur la base de cette hypothèse, nous pouvons arriver à quelques conclusions provisoires.

Différents pays ont imposé différentes mesures. Certains exigent que les gens aient un laissez-passer écrit pour mettre le pied dehors ; d’autres non. Certains ont imposé un arrêt économique complet ; d’autres non. Certains soumettent de nombreuses personnes en bonne santé à des tests de dépistage du coronavirus ; d’autres ne testent que les cas suspects et quelques-uns effectuent des tests dans le cadre d’une autopsie, si tant est qu’ils en effectuent. Comment cela semble-t-il affecter le nombre de décès dus à la COVID-19 ? Eh bien, en rien, en fait ! Cela semble faire autant de différence que de froncer les sourcils et de remuer le doigt devant une boîte de pétri. Le coronavirus se propage comme il devait le faire, et la plupart des personnes qui y sont exposées ne savent même pas qu’elles ont été exposées à quelque chose qui sort de l’ordinaire.

Même si nous augmentons considérablement notre estimation actuelle de 170 000 décès ultimes par COVID-19 à un demi-million et que nous supposons que le coronavirus se propage aux quatre coins de la Terre, cela nous donnerait une létalité de 0,07%. Ce chiffre est tout à fait conforme au bilan de la pandémie H1N1 de 2009. Il faut toutefois noter que la pandémie de 2009 n’a pas provoqué d’effondrement financier et économique. On peut supposer que les dommages causés par les mesures largement futiles prises pour contrôler la propagation du coronavirus, de l’ordre de millions de pertes d’emplois et de nombreuses faillites d’entreprises, seront bien plus graves que les dommages causés par le coronavirus lui-même. Les effets secondaires directement mortels de ces mesures comprendront des taux de meurtre et de suicide nettement plus élevés, des décès dus à la malnutrition et à la famine et des décès dus au manque de soins médicaux de la part des systèmes de santé qui ont été réquisitionnés pour se concentrer sur la COVID-19.

Des personnes saines et responsables arrêteraient-elles leur économie et se ruineraient-elles au nom d’un virus qui n’est pas sans rappeler les dizaines d’autres en circulation qui font tousser et éternuer les gens, et parfois (très rarement) les font mourir ? Non, elles ne le font pas. Nous sommes donc contraints de formuler d’autres hypothèses. Une de ces hypothèses est que la finance mondiale s’est effondrée il y a quelque temps, et que finalement l’idée de continuer comme avant a cessé de fonctionner. Et puis l’économie mondiale s’est effondrée. Heureusement, ce coronavirus est apparu juste à temps pour permettre aux dirigeants d’éviter d’assumer la responsabilité de ce qui s’est passé.

Le coronavirus a fait l’objet d’une campagne de publicité intensive, mais cela ne fonctionnera plus très longtemps. Ce que notre modèle nous dit, c’est que la pandémie de coronavirus a déjà dépassé son point de saturation et qu’elle sera terminée dans un mois ou deux. Le virus aura disparu et les dirigeants déclareront la victoire, mais l’effondrement économique persistera. Certains pays pourront relancer leur économie, tandis que d’autres – ceux qui avaient fermé les yeux sur les problèmes financiers – n’y parviendront pas. Et là, l’effondrement politique suivra l’effondrement économique.

La conclusion la plus significative que nous pouvons tirer de notre modèle est que la pandémie de coronavirus a déjà dépassé son point médian. Cette conclusion est provisoire, car de nouvelles données pourraient briser le modèle. Par exemple, nous pourrions observer un nouveau pic significatif quelques semaines après la fin des mesures de confinement et des couvre-feux. Mais en attendant, la simplicité et la précision de notre modèle en font un bon outil de suivi. Nous continuerons à ajuster notre modèle au fur et à mesure de l’arrivée de nouvelles données et de la publication de mises à jour. Pour l’instant, cependant, notre modèle semble nous dire que le pire est déjà passé. Si vous avez besoin d’une raison d’être optimiste (comme la plupart des gens actuellement), la voici !

Vendredi 17 avril 2020 – Mise à jour 1

Le delta actuel de 5,2 % provient d’un doublement en un seul jour du nombre de décès dus à la COVID-19 aux États-Unis. Ce graphique ne montre que les décès aux États-Unis tels que rapportés quotidiennement.



Ces données ne correspondent à aucun modèle, sauf celui où les médecins et coroners américains inscrivent COVID-19 sur les certificats de décès sans prendre la peine de vérifier que le nouveau coronavirus est la cause du décès. C’est le résultat d’une décision politique plutôt que médicale ou scientifique. Les données sur les déchets ne valent pas la peine d’être modélisées : les déchets entrent, les déchets sortent.

Mise à jour de la mise à jour : Il semble que c’était une erreur et qu’ils l’ont révisée pour la ramener à 2174. Le modèle est à nouveau sur les rails. Notre modèle est un détecteur de conneries instantané et efficace.

Dmitry Orlov
15 avril 2020.
Source : Le Saker Francophone

Articles en relation

Partager ce contenu