Onderzoeksdomeinen

Artificiële intelligentie in voorspellingen: stand van zaken

Weersvoorspellingen op basis van artificiële intelligentie: stand van zaken - juli 2024

Artificiële intelligentie (AI) wordt vandaag gezien als een gamechanger in zowat alle menselijke activiteiten. Ook de meteorologie is doordrongen van AI en in het bijzonder voor het maken van weersvoorspellingen. De nieuwe doorbraken komen daarbij met een soms verontrustende snelheid. AI schudt onze manier van werken grondig door elkaar. Het maakt een aantal taken zeer gemakkelijk, maar dwingt ons tegelijkertijd existentiële vragen te stellen over onze rol als wetenschapper en als meteoroloog.

Sinds eind 2022 kwamen een aantal Big Tech bedrijven, zoals Google, Huawei, NVIDIA naar buiten met nieuwe weersvoorspellingssystemen die gebaseerd zijn op machine learning. Die systemen leveren resultaten die op het eerste gezicht vergelijkbaar of beter zijn dan de voorspellingen van het globale weersvoorspellingsmodel van het Europees Centrum voor Weersverwachtingen op de Middellange Termijn (ECMWF) (zie Fig. 1). Het realisme en de kwaliteit van die voorspellingen is ronduit verbluffend. Bovendien is de vereiste rekenkracht voor  dergelijke voorspellingen buitengewoon klein in vergelijking met de rekenkracht die nodig is om een numerieke weersvoorspelling door te rekenen op een high-performance computer (HPC).

Figuur 1: vergelijking van een voorspelling met drie dagen voorspellingstermijn tussen het machine learning model en het numeriekeweersvoorspellingsmodel van ECWMF  (situatie op 12/2/2024), 500 hPa geopotentiale hoogte en 850 hPa temperatuur. Links, het AIFS (ECMWF) ML model, rechts het NWP model.

Figuur 1: vergelijking van een voorspelling met drie dagen voorspellingstermijn tussen het machine learning model en het numeriekeweersvoorspellingsmodel van ECWMF (situatie op 12/2/2024), 500 hPa geopotentiale hoogte en 850 hPa temperatuur. Links, het AIFS (ECMWF) ML model, rechts het NWP model.

Het ECWMF en de Europese modelleringsgemeenschap hebben hierop gereageerd door zelf onderzoek en ontwikkeling op te starten naar dit soort data-gedreven weersvoorspellingen. Vandaag hebben we een beter, genuanceerd zicht op het potentieel van AI voor het maken van weersvoorspellingen en dat willen we hier graag met onze gebruikers delen.

Hoe worden traditionele numerieke weersvoorspellingen gemaakt?

Numerieke weersvoorspellingen (Eng: Numerical Weather Prediction, NWP) worden gemaakt door de fysische vergelijkingen van de atmosfeer op een supercomputer op te lossen. Essentieel daarbij is de assimilatie van waarnemingen tot atmosferische toestanden. Daarmee bedoelen we een representatie van de toestand van de atmosfeer in het computergeheugen. Dit noemen we een analyse. Een dergelijke analyse kan gebruikt worden als begintoestand voor een model run. In dat geval worden de vergelijkingen numeriek opgelost om de computertoestand vooruit in de tijd te laten evolueren. Dit gebeurt stapsgewijs, letterlijk met kleine stapjes vooruit in de tijd.

De technieken om waarnemingen om te zetten in analyses noemen we data assimilatie. Analyses zijn nodig voor de voorspellingen, maar ze zijn uiterst volledige weergaves van de atmosferische toestand en kunnen op zich onderzocht worden, bijvoorbeeld om het klimaat te bestuderen. Het ECWMF bijvoorbeeld voert zogenaamde reanalyses uit. Daarbij wordt de meest recente versie van het model gebruikt om voor een lange periode analyses aan te maken.

De laatst uitgevoerde reanalyse heet ERA5. De geleverde datasets hebben een resolutie van 31 kilometer en 137 verticale niveaus vertrekkende van het aardoppervlak tot een hoogte van 80 km. ERA5 gebruikt de recentste modelleringstechnieken en assimileert alle mogelijke beschikbare waarnemingen, gaande van stations data, sneeuwmetingen, sensoren op boten, vliegtuigen, ballonpeilingen, GPS en satellietgegevens. ERA5 verschaft analyses van 1940 tot vandaag voor alle mogelijke  meteorologische variabelen en is vrij beschikbaar.

De kwaliteit van de analyses wordt bepaald door de kwaliteit van het numerieke weersvoorspellingsmodel, de kwaliteit en de hoeveelheid van de geassimileerde waarnemingen, en de kwaliteit van de gebruikte data assimilatie technieken.

Hoe worden op machine learning gebaseerde weersvoorspellingen gemaakt?

Voor data-gedreven machine learning wordt een subset van de ERA5 data gebruikt die beschikbaar is met tijdsintervallen van 1 uur op 37 niveaus. Daarbij traint men een AI systeem om op basis van reanalyses op een bepaald tijdstip de beschikbare reanalyses een uur later optimaal te reproduceren. Als je dat getrainde model loslaat op begintoestanden van het weersvoorspellingsmodel en de procedure herhaalt, dan krijg je op machine learning gebaseerde weersvoorspellingen (MLWV).

Het verbluffende daarbij is dat men AI kan trainen om het beter te doen dan het oorspronkelijke voorspellingsmodel, althans voor een aantal specifieke variabelen, zie Fig. 2. Daar moet wel aan toegevoegd worden dat je een dergelijk AI systeem niet kan ontwikkelen zonder een goed numeriek weersvoorspellingssysteem.

Figuur 2: RMSE scores van het numeriek weersvoorspellingsmodel IFS in vergelijking met AI modellen (AIFS, FourCastNet, GraphCast,FuXi en Pangu-Weather), na 6 dagen hebben de AI modellen een betere score.

Figuur 2: RMSE scores van het numeriek weersvoorspellingsmodel IFS in vergelijking met AI modellen (AIFS, FourCastNet, GraphCast,FuXi en Pangu-Weather), na 6 dagen hebben de AI modellen een betere score.

Wat kunnen MLWV niet voorspellen?

Voorlopig is het nog niet duidelijk wat de kwaliteit is van voorspellingen van een aantal variabelen zoals neerslag en zijn er nog een aantal variabelen die niet door MLWV voorspeld worden, onder andere mist en zonnestraling. Bovendien gebruiken voorspellers gespecialiseerde variabelen die inzicht geven in de toestand van de atmosfeer. We zeggen wel voorlopig, want er wordt hard gewerkt om die variabelen ook in de AI modellen te brengen.

Kunnen we zonder NWP?

Voorlopig kunnen we niet zonder NWP. Experts in ons vakgebied zijn van mening dat we nooit zonder fysische modellen zullen kunnen, al is het maar voor verder onderzoek in de meteorologie. Je hebt datasets nodig om de AI modellen te trainen. De gebruikte ERA5 data heeft een resolutie van 31 kilometer, terwijl lokale modellen resoluties hebben van enkele kilometers. Het ALARO model van het KMI draait bijvoorbeeld met een resolutie van 1.3 km. De huidige globale MLWV modellen kunnen dus niet getraind worden voor dergelijke resoluties en bevatten ook geen relevante informatie op dergelijke kleine schalen.

De performantie van MLWV blijkt voorlopig ook minder betrouwbaar te zijn voor wat extremen betreft. Bijvoorbeeld uit een recente verificatie van stormvoorspellingen voor België blijkt dat de intensiteit doorgaans onderschat wordt.

Tenslotte zijn fysische modellen nog altijd vereist voor onderzoek naar atmosferische fysica. De rol van menselijke expertise, zoals de die weersvoorspellers zal veranderen maar zal des te belangrijker worden. Inzicht in atmosferische fysica blijft hoe dan ook cruciaal en zal dat altijd zijn.

Cookies opgeslagen