in

Un nouveau cadre d'IA peut découvrir des équations de physique spatiale dans les données brutes

Un nouveau cadre d'IA peut découvrir des équations de physique spatiale dans les données brutes

Les systèmes d’intelligence artificielle (IA), en particulier les réseaux de neurones artificiels, se sont révélés être des outils très prometteurs pour découvrir des modèles dans de grandes quantités de données qui seraient autrement difficiles à détecter. Au cours de la dernière décennie, les outils d’IA ont été appliqués dans un large éventail de contextes et de domaines.

Parmi leurs nombreuses applications possibles, les systèmes d'IA pourraient être utilisés pour découvrir des relations physiques et des expressions symboliques (c'est-à-dire des formules mathématiques) décrivant ces relations.

Pour découvrir ces formules, les physiciens doivent actuellement analyser de manière approfondie les données brutes. L’automatisation de ce processus pourrait donc s’avérer très avantageuse.

Des chercheurs de l’Université Tsinghua, de l’Université de Pékin et d’autres instituts chinois ont développé un cadre d’IA capable de dériver automatiquement des représentations physiques symboliques à partir de données brutes. Ce nouveau modèle, appelé PhyE2E, a été présenté dans un article publié dans Intelligence des machines naturelles.

« Notre objectif était de pousser l'IA au-delà de l'ajustement des courbes et vers une découverte compréhensible par l'homme : en renvoyant des équations compactes et cohérentes par unité que les scientifiques peuvent lire, tester et sur lesquelles s'appuyer », a déclaré Yuan Zhou, co-auteur principal de l'article, à Issues.fr.

« Nous nous sommes d'abord concentrés sur la physique spatiale, où des enregistrements d'observation longs et bien organisés nous permettent de vérifier si les équations apprises correspondent réellement à la nature. L'approche elle-même est générale et nous espérons qu'elle s'étendra à d'autres sciences. »

Un modèle qui représente symboliquement les données physiques

PhyE2E, le nouveau framework d'IA introduit par Zhou et ses collègues, a été formé sur des données physiques et des équations mathématiques. Au cours de la formation, le modèle a appris à quoi « ressemblent » des formules plausibles liées à la physique, en affinant des équations physiques largement établies, puis en en produisant d'autres en synthétisant diverses variantes cohérentes avec les unités.

« PhyE2E utilise un transformateur pour traduire les données directement en une expression symbolique et ses unités », a expliqué Zhou.

« Il applique une étape diviser pour régner qui inspecte les dérivées du second ordre d'un réseau « oracle » léger pour diviser un problème difficile en sous-formules plus simples et effectue un bref affinement MCTS/GP pour ranger les constantes et la structure. Le résultat est une équation compacte, interprétable et dimensionnellement cohérente. « 

Dans le cadre de leur récente étude, les chercheurs ont testé leur cadre à la fois sur des données synthétiques générées par un grand modèle de langage (LLM) et sur des données astrophysiques réelles collectées par la NASA.

En fin de compte, ils ont pu dériver des formules décrivant les relations physiques dans les données liées à cinq scénarios réels de physique spatiale. Notamment, les formules dérivées correspondaient à celles dérivées par les physiciens humains ou semblaient représenter les données encore mieux.

Par exemple, lors de l’analyse des données publiées par la NASA en 1993, le modèle a abouti à une formule améliorée expliquant mathématiquement les cycles solaires. De plus, il a pu représenter efficacement les relations entre le rayonnement solaire, la température et les champs magnétiques.

Un outil prometteur pour la découverte scientifique

Essentiellement, le nouveau modèle d’IA développé par cette équipe de recherche apprend à décomposer des problèmes de physique complexes en parties plus simples. S'appuyant sur des équations existantes et bien établies, il peut ensuite générer de nouvelles formules décrivant efficacement la relation entre différentes variables.

« Bien qu'il soit trivial d'écrire une expression longue qui interpole les données, et qu'il soit tentant de privilégier les expressions très courtes, aucune des deux ne garantit la signification physique – de nombreuses formules candidates violent même la cohérence dimensionnelle (unité) », a déclaré Zhou.

« Nous exploitons les progrès récents dans les grands modèles de langage pour apprendre une a priori sur des équations cohérentes avec des unités connues, puis l'affiner afin que le système propose des expressions compactes et physiquement plausibles qui contiennent de véritables informations. Nous considérons cela comme une première étape vers l'abstraction et l'extension de l'expérience scientifique pour permettre une découverte automatisée. « 

PhyE2E pourrait bientôt être utilisé pour analyser d’autres données expérimentales et astrophysiques, ce qui pourrait donner lieu à des formules décrivant mieux des phénomènes ou interactions physiques spécifiques. À l’avenir, elle pourrait également être adaptée et appliquée à d’autres disciplines, contribuant ainsi potentiellement à la découverte scientifique dans divers domaines.

« Nous étendons maintenant le cadre aux opérateurs sensibles au calcul (par exemple, les dérivées/intégrales pour les lois de type PDE), renforçant ainsi la robustesse des données de laboratoire plus bruyantes », a ajouté Zhou.

« Plus largement, l'objectif central de notre recherche est de faire progresser la méthodologie neuro-symbolique afin que les prédictions des réseaux neuronaux profonds soient interprétables. Dans le même temps, nous espérons que l'intégration de l'explicabilité comme principe de conception pourra améliorer la capacité d'un système d'IA à découvrir des lois scientifiques plus précises et plus fiables. »

Écrit pour vous par notre auteur Ingrid Fadelli, édité par Sadie Harley, et vérifié et révisé par Robert Egan, cet article est le résultat d'un travail humain minutieux. Nous comptons sur des lecteurs comme vous pour maintenir en vie le journalisme scientifique indépendant. Si ce reporting vous intéresse, pensez à faire un don (surtout mensuel). Vous obtiendrez un sans publicité compte en guise de remerciement.

La pollution radioactive hante toujours Hunters Point à San Francisco

La pollution radioactive hante toujours Hunters Point à San Francisco

Un essai laser à l'ESO ouvre une nouvelle ère de l'interférométrie

Un essai laser à l'ESO ouvre une nouvelle ère de l'interférométrie