Domaines de recherche
Intelligence artificielle dans les prévisions : état des lieux
Prévisions météorologiques basées sur l'intelligence artificielle : état des lieux - juillet 2024
L'intelligence artificielle (IA) est aujourd'hui considérée comme un facteur de changement dans presque toutes les activités humaines. La météorologie, elle aussi, est imprégnée par l'IA, en particulier pour l'établissement des prévisions météorologiques. Ce faisant, les nouvelles percées se succèdent à une vitesse parfois alarmante. L'IA bouleverse profondément notre façon de travailler. Elle rend certaines tâches très faciles, mais nous oblige en même temps à nous poser des questions existentielles sur notre rôle en tant que scientifiques et météorologues.
Depuis la fin de l'année 2022, un certain nombre de grandes entreprises technologiques telles que Google, Huawei et NVIDIA ont mis au point de nouveaux systèmes de prévision météorologique basés sur l'apprentissage automatique. Ces systèmes donnent des résultats qui, à première vue, sont comparables ou meilleurs que les prévisions du modèle de prévision météorologique mondiale du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT) (voir figure 1). Le réalisme et la qualité de ces prévisions sont tout simplement stupéfiants. De plus, la puissance de calcul requise pour ces prévisions est extrêmement faible par rapport à la puissance de calcul nécessaire pour exécuter une prévision météorologique numérique à l'aide d'un ordinateur à haute performance (HPC).
Le CEPMMT et la communauté européenne de la modélisation ont réagi en lançant leurs propres travaux de recherche et de développement sur ce type de prévisions météorologiques basées sur des données. Aujourd'hui, nous avons une vision plus nuancée du potentiel de l'IA pour les prévisions météorologiques et nous souhaitons la partager ici avec nos utilisateurs.
Comment les prévisions météorologiques numériques traditionnelles sont-elles établies ?
La prévision météorologique numérique (Eng : Numerical Weather Prediction, NWP) est réalisée en résolvant les équations physiques de l'atmosphère sur un superordinateur. L'assimilation des observations vers des états atmosphériques est ici essentielle. Nous entendons par là, une représentation de l'état de l'atmosphère dans la mémoire de l'ordinateur. C'est ce que nous appelons une analyse. Une telle analyse peut être utilisée comme état initial pour une exécution du modèle. Dans ce cas, les équations sont résolues numériquement pour faire évoluer l'état de l'ordinateur dans le temps. Cela se fait de manière incrémentale, littéralement par petits pas en avant dans le temps.
Les techniques permettant de transformer les observations en analyses sont appelées assimilation de données. Les analyses sont nécessaires pour réaliser les prévisions, mais elles constituent surtout des représentations extrêmement complètes de l'état de l'atmosphère et, de ce fait, peuvent être étudiées en tant que telles, par exemple pour étudier le climat. Le CEPMMT, par exemple, effectue ce que l'on appelle des réanalyses. Il s'agit d'utiliser la version la plus récente du modèle pour créer des analyses sur une longue période.
La dernière réanalyse effectuée s'appelle ERA5. Les jeux de données fournis ont une résolution de 31 kilomètres et 137 niveaux verticaux allant de la surface de la Terre jusqu'à une altitude de 80 km. ERA5 utilise les techniques de modélisation les plus récentes et assimile toutes les observations disponibles, qu'il s'agisse de données de stations, de mesures de la neige, de capteurs à bord de bateaux, d'avions, de ballons-sondes, de GPS ou de données satellitaires. ERA5 fournit des analyses de 1940 à aujourd'hui pour toutes les variables météorologiques possibles et est disponible gratuitement.
La qualité des analyses est déterminée par la qualité du modèle numérique de prévision météorologique, la qualité et la quantité des observations assimilées et la qualité des techniques d'assimilation de données utilisées.
Comment les prévisions météorologiques basées sur l'apprentissage automatique sont-elles établies ?
L'apprentissage automatique basé sur les données utilise un sous-ensemble des données ERA5 disponibles à des intervalles de temps d'une heure à 37 niveaux. Ainsi, un système d'intelligence artificielle est entraîné à reproduire de manière optimale les réanalyses disponibles une heure plus tard sur la base des réanalyses à un moment donné. Si l'on libère ce modèle entraîné sur les états initiaux du modèle de prévision météorologique et que l'on répète la procédure, on obtient des prévisions météorologiques basées sur l'apprentissage automatique (PMAA).
Ce qui est étonnant, c'est que l'on peut entraîner l'IA à faire mieux que le modèle de prévision original, au moins pour certaines variables spécifiques (voir figure 2). Il convient toutefois d'ajouter qu'il n'est pas possible de développer un tel système d'IA sans un bon système numérique de prévision météorologique.
Qu'est-ce que les PMAA ne peuvent pas prédire ?
Pour l'instant, la qualité des prévisions de certaines variables telles que les précipitations n'est pas claire et il existe encore des variables qui ne sont pas prévues par les PMAA, notamment le brouillard et le rayonnement solaire. En outre, les prévisionnistes utilisent des variables spécialisées qui donnent un aperçu de l'état de l'atmosphère. Nous disons "provisoirement", car de nombreux travaux sont en cours pour intégrer ces variables dans les modèles d'intelligence artificielle.
Peut-on se passer des modèles numériques de prévision ?
Pour l'instant, nous ne pouvons pas nous passer des NWP. Les experts dans notre domaine pensent que nous ne pourrons jamais nous passer de modèles physiques, ne serait-ce que pour poursuivre la recherche en météorologie. Il faut des jeux de données pour entraîner les modèles d'intelligence artificielle. Les données ERA5 utilisées ont une résolution de 31 kilomètres, alors que les modèles locaux ont des résolutions de quelques kilomètres. Par exemple, le modèle ALARO de l'IRM fonctionne à une résolution de 1,3 km. Les modèles PMAA globaux actuels ne peuvent donc pas être entraînés pour de telles résolutions et ne contiennent pas non plus d'informations pertinentes à des échelles aussi petites.
Les performances des PMAA semblent également, pour le moment, moins fiables en ce qui concerne les extrêmes. Par exemple, une vérification récente des prévisions de tempêtes pour la Belgique montre que l'intensité est généralement sous-estimée.
Enfin, les modèles physiques restent nécessaires pour la recherche en physique de l'atmosphère. Le rôle de l'expertise humaine, comme celui des prévisionnistes météorologues, changera mais deviendra d'autant plus important. La compréhension de la physique de l'atmosphère reste de toute façon cruciale et le restera toujours.