L'intelligence artificielle entraîne un changement sismique dans la façon dont nous abordons les prévisions météorologiques, avec une rafale de nouveaux modèles de prédiction météorologique de l'IA qui débute ces dernières années qui présentent un certain nombre d'avantages potentiels par rapport aux modèles traditionnels. Ceux-ci incluent des vitesses plus rapides, une réduction de la demande de ressources informatiques et des performances de prévision améliorées pour certains phénomènes météorologiques, en particulier sur des périodes de temps plus longues.
Malgré l'excitation autour de ces nouveaux modèles, ils ont actuellement des limites importantes, et ils ne sont pas non plus faciles à adapter et à utiliser pour la communauté de recherche plus large pour faire de nouveaux progrès scientifiques.
Maintenant, le Centre national national de recherche atmosphérique (NSF NCAR) de la National Science Foundation américaine (NSF NCAR) a publié une nouvelle plate-forme qui vise à rendre les modèles météorologiques d'IA plus accessibles. Les objectifs sont de faciliter l'utilisation de l'IA pour répondre aux questions scientifiques aux frontières de la recherche météorologique et de permettre à davantage de chercheurs de revenir à l'élargissement des capacités de la modélisation météorologique de l'IA. La recherche est publiée sur le arxiv serveur de préimprimée.
« Lorsque notre équipe a commencé à construire notre premier modèle météorologique de l'IA, nous avons trouvé peu de conseils accessibles au public sur la façon de former ces modèles à grande échelle. Nous avons dû apprendre à la dure à travers des essais et des erreurs et de nombreuses discussions avec d'autres experts », a déclaré David John Gagne, qui dirige les efforts des sciences de l'apprentissage automatique de NSF NCAR.
« Notre objectif est de fournir une plate-forme qui permet à notre communauté de recherche de former facilement des modèles sur des ensembles de données particuliers, puis de les configurer pour fonctionner sur nos ressources informatiques disponibles, le tout sans avoir à être un expert en intelligence artificielle ou en supercalcul. Nous voulons réduire les obstacles à l'entrée et obtenir cette technologie potentiellement transformatrice entre les mains de nombreux chercheurs plus intéressés. »
La nouvelle plate-forme s'appelle la communauté Research Earth Digital Intelligence Twin (Credit), et elle a trois parties importantes: une bibliothèque de modèles d'IA, plusieurs ensembles de données pré-préparés et de haute qualité pour former ces modèles et accès à l'informatique haute performance. En fin de compte, il permet aux chercheurs de choisir entre différentes architectures de modèle et bases de données, puis les aide à former le modèle sans avoir une connaissance approfondie de l'informatique haute performance.
Premiers pas vers un nouveau type de modèle communautaire
NSF NCAR a un riche héritage de fournir des modèles météorologiques de haut vol et open source à la communauté et de fournir une formation et un soutien. En fin de compte, plus les gens utilisent ces modèles communautaires, mieux ils s'appliquent parce que les utilisateurs contribuent à leurs propres améliorations et mises à niveau du code du modèle.
À ce jour, ces modèles communautaires ont été des modèles informatiques traditionnels, ce qui signifie que l'ordinateur résout des équations qui représentent les processus physiques dans l'atmosphère – du cycle à petite échelle des courants ascendants et des courants descendant qui créent un orage au mouvement à grande échelle des masses d'air qui entrent en collision, créant des fronts chauds et des fronts froids. Ces modèles sont construits sur une compréhension de la physique atmosphérique, et ils sont capables de fournir des simulations extrêmement réalistes sur la façon dont le temps se déroule sur Terre.
Mais ces modèles ont des défis. D'une part, l'augmentation de la résolution du modèle pour étudier les phénomènes météorologiques localisés à plus petite échelle nécessite une augmentation massive des ressources de calcul. Par exemple, doubler la résolution d'un modèle (à la fois horizontalement et verticalement) nécessite une augmentation de 16 fois la puissance de calcul.
La demande de calcul intense de ces modèles limite également la quantité de fois qu'un modèle peut être exécuté. L'exécution de plusieurs simulations au cours de la même période – connue comme un ensemble – peut donner aux prévisionnistes des informations cruciales sur la quantité d'incertitude dans les prévisions, mais cela nécessite également de grandes quantités de puissance de calcul.
Les modèles traditionnels luttent également dans des domaines où notre compréhension scientifique de la façon dont un phénomène se forme ou se comporte est incomplet et ne peut donc pas être aussi facilement exprimé en utilisant des équations mathématiques. Celles-ci ont tendance à être les événements météorologiques qui sont obstinément difficiles à prédire avec précision, comme l'intensification rapide des ouragans ou la croissance de la grêle dommageable.
Les modèles météorologiques de l'IA ont le potentiel de faire face à ces lacunes. Contrairement aux modèles traditionnels, les modèles d'IA ne résolvent pas les équations individuelles. Au lieu de cela, ils recherchent des modèles et des associations dans les données qui donnent un aperçu de ce qui va se passer ensuite. Cette approche réduit considérablement la demande informatique et permet également aux modèles de trouver des moyens de prédire les phénomènes pour lesquels nous ne pouvons pas facilement écrire des équations.
Ce potentiel et l'avancement rapide de l'IA en général ont conduit à une profusion de nouveaux modèles développés par des entreprises technologiques, des organisations à but non lucratif, des agences gouvernementales et des universités. Mais ces modèles présentent leurs propres inconvénients, y compris une tendance aux petites erreurs à se développer rapidement en grandes erreurs. Et les modèles météorologiques de l'IA sont aussi bons que les données utilisées pour les former. Différentes questions peuvent nécessiter l'utilisation de différentes données de formation, qui peuvent être difficiles à trouver et à préparer à l'utilisation par les modèles d'IA.
Le crédit est la première incursion de NSF NCAR dans la construction d'une plate-forme de modélisation de l'IA communautaire pour aider à faciliter les progrès de la recherche en sciences des systèmes de terre. Il y a encore du travail à faire avant que le crédit soit une ressource de modélisation communautaire robuste. En particulier, le succès des modèles communautaires de NSF NCAR repose fortement sur la documentation, la formation et le support approfondies que NSF NCAR fournit, et cet écosystème de support utilisateur n'est pas encore construit pour le crédit.
Pourtant, le logiciel de crédit, qui est accessible au public en téléchargement, est une étape importante pour mettre la puissance de l'IA entre les mains de plus de chercheurs du système de terre.
« Nous voulons que les scientifiques puissent se concentrer sur leurs objectifs de recherche plutôt que sur les détails techniques », a déclaré Gagne. « Ce cadre rend l'IA accessible à un large éventail d'utilisateurs, des chercheurs atmosphériques expérimentés aux étudiants qui commencent juste leurs voyages. »
Compétitif avec les modèles météorologiques traditionnels
Dans le processus de création et de test de crédit, l'équipe NSF NCAR a également construit WXFORMER, un nouveau modèle météorologique d'IA spécialement conçu pour être utilisé pour les questions de recherche météorologique et pour répondre à certains des lacunes de la modélisation météorologique de l'IA existante, y compris de nouvelles stratégies pour limiter la croissance des erreurs et permettre des étapes de temps plus courtes.
La plupart des modèles météorologiques d'IA existants fournissent des informations dans des intervalles de six heures, mais WXFORMER peut fournir des prévisions toutes les heures. WXFORMER est maintenant l'un des modèles que les chercheurs peuvent choisir parmi la bibliothèque de Credit, ainsi que d'autres qui ont publié leurs codes.
En utilisant le crédit pour former et configurer les modèles, l'équipe NSF NCAR a testé les performances de WXFORMER et FUXI, un autre modèle d'IA disponible dans la bibliothèque de Credit, contre les prévisions du système de prévision intégré à haute résolution (HRES-IF), un modèle météorologique standard développé par le Centre européen pour les prévisions météorologiques moyennes qui sont largement considérées comme l'un des modèles météorologiques les plus performants dans le monde.
WXFORMER et FUXI ont démontré qu'ils pouvaient fournir les mêmes prévisions ou meilleures que les HRES-IF à des délais prolongés pour la plupart des variables atmosphériques. Par exemple, les scientifiques ont testé dans quelle mesure les modèles prédisaient la piste et l'intensité de l'ouragan Laura, qui a frappé l'ouest de la Louisiane comme tempête de catégorie 4 en 2020.
Ils ont constaté que WXFORMER avait fait le meilleur travail pour prédire l'intensité de l'ouragan à cinq jours, bien que sa piste prévue soit trop loin au sud. Une version de WXFORMER qui produit des prévisions horaires a capturé la piste de l'ouragan plus précisément, mais a prédit une tempête beaucoup plus faible à cinq jours.
Le modèle FUXI a prédit une tempête faible à cinq jours et a connu des erreurs de piste similaires à WXFORMER. Le modèle HRES-IFS a également prédit une tempête très faible à cinq jours et a eu quelques erreurs de piste dans la direction opposée des modèles AI.
Au total, les résultats soulignent le potentiel de crédit et indiquent les orientations pour les travaux futurs. Déjà, l'équipe a produit une version mise à jour du logiciel de crédit qui augmente la convivialité et l'évolutivité des utilisateurs de la plateforme.
Ils travaillent également sur un autre modèle d'IA qui peut imiter le modèle d'atmosphère communautaire (CAM) basé sur NSF NCAR, qui est une composante du modèle de système de terre communautaire plus large, qui relie les modèles d'océan, d'atmosphère, de terre et de glace ensemble. Le « Camulator » faciliterait l'intégration de la modélisation d'IA dans les simulations mondiales du système de terre.
Le développement de Credit est également soutenu par un effort parallèle au NSF NCAR pour créer un « Data Commons intégré » qui rendrait les vastes ensembles de données de l'organisation plus accessibles pour la formation des modèles d'IA. Le fait d'avoir des données de haute qualité est le fondement de l'IA et les nouveaux communes de données serviront de base au développement futur du modèle d'IA.
« Nous sommes ravis de voir quels problèmes le crédit peut aider à résoudre et où cela peut aller avec l'aide et la participation de la communauté plus large », a déclaré Gagne. « Notre objectif est que le crédit soit un environnement ouvert et collaboratif où les chercheurs à différents niveaux d'expertise peuvent contribuer à l'évolution du cadre. »


