TU/e'ers voorspellen groei coronabesmettingen per land
Datawetenschappers van de TU/e kunnen het te verwachten aantal nieuwe besmettingen en doden als gevolg van het Covid-19-virus berekenen voor de nabije toekomst. Dit doen ze door populatiegroeimodellen los te laten op wereldwijde coronadata. Voor de vier landen met het hoogste aantal besmettingen (China, Zuid-Korea, Iran en Italië) is een nauwkeurige voorspelling mogelijk van één tot drie dagen vooruit. Voor Zuid-Korea en Iran kunnen de onderzoekers bovendien al het maximale aantal infecties schatten. Op korte termijn wordt dit ook voor andere landen mogelijk, zoals Nederland en de Verenigde Staten.
“Wereldwijd zijn onderzoekers bezig de groei van coronabesmettingen te analyseren, maar het daadwerkelijk doen van nauwkeurige voorspellingen is vrij lastig”, stelt Edwin van den Heuvel, hoogleraar statistiek aan de TU/e. Samen met twee collega’s laat hij zijn kennis van statistiek en groeicurves los op de coronadata om deze zeer gewilde berekeningen te maken. “We zijn data scientists, hier moesten we iets mee.”
Het lijkt misschien triviaal om de lijn van besmettingen door te trekken, maar volgens Van den Heuvel komt hier echt wel het nodige bij kijken. "De vraag is steeds wanneer de toename gaat afvlakken, waar zit het maximum?"
Voor China, Zuid-Korea en Iran zijn de onderzoekers nu in staat een inschatting te maken voor het aantal nieuwe besmettingen door het virus voor de eerstvolgende drie dagen, met een nauwkeurigheid van ruim 81 procent. Voor Italië lukt dit vooralsnog één dag vooruit, met meer data kan verder vooruit worden gekeken. Van den Heuvel verwacht echter dat hij binnen enkele dagen ook voor landen als de Verenigde Staten en Nederland genoeg betrouwbare data heeft om dit te doen.
“We blijven ons model verbeteren, zodat we nog verder vooruit kunnen voorspellen”, zegt Van den Heuvel. Ook gaan de datawetenschappers kijken naar het effect van maatregelen en de opbouw van de bevolking in China. “Hiermee hopen we sneller te kunnen voorspellen waar het maximum zit, zodat we weten hoeveel mensen er in totaal besmet zullen raken of overlijden als gevolg van het virus”, aldus de hoogleraar. "Ook hopen we hiermee inzichten te krijgen welke factoren het aantal besmettingen en doden beinvloeden."
Populatiemodellen Verhulst
Van den Heuvel baseerde zich op de beroemde logistische functie, ontwikkeld door de Belgische wiskundige Pierre Francois Verhulst rond 1845. Deze functie beschrijft hoe een populatie groeit door de tijd, en heeft een S-vorm: in het begin groeit de bevolking langzaam, gevolgd door een steeds sterker wordende stijging, die vervolgens afvlakt tot een maximum.
Dit populatiemodel pasten de wetenschappers eerst toe op de data uit China. “Het totale aantal besmettingen voor iedere provincie in China bleek heel precies die logistische groei te volgen”, zegt Van den Heuvel. Met de Chinese data konden de onderzoekers zodoende hun voorspellingsmodel kalibreren, om vervolgens onderschattingen voor het maixmale aantal nieuwe besmettingen en doden in andere landen te corrigeren. “Die voorspellingen bleken goed te kloppen voor Iran, Italië en Zuid-Korea.”
De laatste voorspellingen van de datawetenschappers volgen? Deze pagina geeft regelmatig een update.
Discussie