Onderzoekers op Northeastern gebruiken Google Cloud Platform om de verspreiding van het zikavirus in kaart te brengen

Het Modeling of Biological and Socio-technical Systems-lab (MoBS) van Northeastern University moest snel een model kunnen maken van het zikavirus. Met GCE en verwijderbare virtuele machines heeft MoBS meer dan 10 miljoen simulaties uitgevoerd en de tijd die het kost om gegevens te analyseren, sterk verkort.

Toen het door muggen verspreide zikavirus zich in 2015 snel verspreidde in Noord-, Zuid- en Midden-Amerika, werden reisverboden uitgevaardigd en mensen in quarantaine geplaatst. Er werd zelfs opgeroepen om de Olympische Spelen van 2016 in Brazilië te annuleren. Toen de Wereldgezondheidsorganisatie een internationale noodsituatie op het gebied van de volksgezondheid afkondigde, hadden de overheden van de betreffende landen een manier nodig om de hoeveelheid en locaties van nieuwe infecties nauwkeurig te kunnen voorspellen. Omdat slechts twintig procent van de mensen die met het zikavirus zijn geïnfecteerd, ziek wordt, is de verspreiding van het virus erg moeilijk te voorspellen.

In januari 2016 startte het team van het MoBS-lab van Northeastern University, met ondersteuning van het Center for Inference and Dynamics of Infectious Diseases, met het Zika Modeling Project, waarmee overheden en onderzoekers de ontwikkeling en verspreiding van het zikavirus beter kunnen begrijpen.

Wat zeggen de onderzoekers

"Met behulp van big data en een enorme rekenkracht hopen we onderzoekers en gezondheidsorganisaties te kunnen helpen."

Matteo Chinazzi, Assistent-onderzoekswetenschapper, Northeastern University

GCP: essentiële voorspellingstools, analysetools en meer

Door wiskundig en met berekeningen te werk te gaan, mogelijk gemaakt door Google Cloud Platform (GCP), heeft het team verschillende scenario's bestudeerd voor de verspreiding van het zikavirus en welke gevolgen dit heeft voor de bevolking in die gebieden. Het model is gebaseerd op hoe het virus zich in het begin verspreidde in Brazilië, waar het uitbrak in 2015. De onderzoekers kunnen de gevolgen van nieuwe infecties in andere gebieden voorspellen door aanvullende gegevenslagen toe te voegen, zoals temperatuur, aantal muggen, grootte van de populatie en het reisgedrag van de mensen.

Met GCP kan het team verschillende simulaties naast elkaar laten uitvoeren en de terabytes aan gegevens analyseren die door de modelscenario's worden verzameld. "We gebruiken verschillende GCP-producten", zegt Matteo Chinazzi, assistent onderzoekswetenschapper op Northeastern University. "Google Cloud Storage slaat alle gegevens uit de modellen op en host de website. Google Compute Engine (GCE) en verwijderbare virtuele machines voeren de simulaties van de verspreiding van de ziekte uit. Google BigQuery analyseert de gesimuleerde scenario's, die allemaal verschillende variabelen bevatten, zoals datums en aantal geïnfecteerden. We hebben al honderden terabytes aan gegevens verzameld. Alles wordt opgeslagen in Google Cloud Storage."

Snel resultaten op schaal verzamelen

Met GCE en verwijderbare virtuele machines heeft MoBS meer dan 10 miljoen simulaties uitgevoerd. Door GCE en BigQuery is de tijd die het kost om simulaties uit te voeren en gegevens te analyseren drastisch verkort. (Beide processen kosten nu slechts enkele uren in plaats van weken.) "We hebben de flexibiliteit om duizenden onafhankelijke virtuele instanties naast elkaar uit te laten voeren", zegt hij. "We kunnen dus in minder dan een dag een volledige analyse uitvoeren voor één epidemiescenario, dat 250.000 onafhankelijke simulaties kan bevatten."

Het model helpt onderzoekers niet alleen de verspreiding van het zikavirus beter te begrijpen, het kan ook een template worden om andere epidemieën, zoals dengue (knokkelkoorts), te analyseren. Hoewel het zikavirus volgens de Wereldgezondheidsorganisatie geen internationale noodsituatie meer is, moet er nog wel hard worden gewerkt om te voorkomen dat door muggen overgedragen ziekten op meer plekken uitbreken. Met big data en onbeperkte rekenkracht hoopt het team van MoBS onderzoekers en gezondheidsorganisaties hierbij te helpen.

"Tijd is van het grootste belang wanneer een ziekte uitbreekt", zegt Chinazzi. "Met GCP hebben we de tools om snel op de juiste schaal actie te kunnen ondernemen."

Als je meer wilt lezen over het zikaonderzoek en de analyses die zijn uitgevoerd door het MoBS-lab, kun je 'Spread of Zika virus in the Americas' (De verspreiding van het zikavirus in Noord-, Zuid- en Midden-Amerika) bekijken, gepubliceerd door Proceedings of the National Academy of Sciences of the United States of America.

Wat zeggen de onderzoekers

"We hebben de flexibiliteit om duizenden onafhankelijke virtuele instanties naast elkaar uit te laten voeren, zodat we binnen een dag een volledige analyse kunnen uitvoeren voor één epidemiescenario, dat 250.000 onafhankelijke simulaties kan bevatten."

Matteo Chinazzi, Assistent-onderzoekswetenschapper, Northeastern University

Organisatieprofiel

Het Modeling of Biological and Socio-technical Systems-lab (MoBS) van Northeastern University maakt gegevensmodellen om de verspreiding van infectieziekten in kaart te brengen, sociaal menselijk gedrag te bestuderen, de evolutie van complexe sociale en technologische netwerken in kaart te brengen, het gebruik van en de verkeerspatronen in technologische netwerken (zoals het internet) op te halen en de interactie tussen sociale dynamiek en online gedrag te bestuderen.

Gebruikte producten

Hartelijk dank voor je aanmelding.

Laat ons weten waarin je geïnteresseerd bent.