Un nouveau cadre d'IA peut découvrir des équations de physique spatiale dans les données brutes

Les systèmes d’intelligence artificielle (IA), en particulier les réseaux de neurones artificiels, se sont révélés être des outils très prometteurs pour découvrir des modèles dans de grandes quantités de données qui seraient autrement difficiles à détecter. Au cours de la dernière décennie, les outils d’IA ont été appliqués dans un large éventail de contextes et de domaines.

Parmi leurs nombreuses applications possibles, les systèmes d'IA pourraient être utilisés pour découvrir des relations physiques et des expressions symboliques (c'est-à-dire des formules mathématiques) décrivant ces relations.

Pour découvrir ces formules, les physiciens doivent actuellement analyser de manière approfondie les données brutes. L’automatisation de ce processus pourrait donc s’avérer très avantageuse.

Des chercheurs de l’Université Tsinghua, de l’Université de Pékin et d’autres instituts chinois ont développé un cadre d’IA capable de dériver automatiquement des représentations physiques symboliques à partir de données brutes. Ce nouveau modèle, appelé PhyE2E, a été présenté dans un article publié dans Intelligence des machines naturelles.

« Notre objectif était de pousser l'IA au-delà de l'ajustement des courbes et vers une découverte compréhensible par l'homme : en renvoyant des équations compactes et cohérentes par unité que les scientifiques peuvent lire, tester et sur lesquelles s'appuyer », a déclaré Yuan Zhou, co-auteur principal de l'article, à Issues.fr.

« Nous nous sommes d'abord concentrés sur la physique spatiale, où des enregistrements d'observation longs et bien organisés nous permettent de vérifier si les équations apprises correspondent réellement à la nature. L'approche elle-même est générale et nous espérons qu'elle s'étendra à d'autres sciences. »

Un modèle qui représente symboliquement les données physiques

PhyE2E, le nouveau framework d'IA introduit par Zhou et ses collègues, a été formé sur des données physiques et des équations mathématiques. Au cours de la formation, le modèle a appris à quoi « ressemblent » des formules plausibles liées à la physique, en affinant des équations physiques largement établies, puis en en produisant d'autres en synthétisant diverses variantes cohérentes avec les unités.

« PhyE2E utilise un transformateur pour traduire les données directement en une expression symbolique et ses unités », a expliqué Zhou.

« Il applique une étape diviser pour régner qui inspecte les dérivées du second ordre d'un réseau « oracle » léger pour diviser un problème difficile en sous-formules plus simples et effectue un bref affinement MCTS/GP pour ranger les constantes et la structure. Le résultat est une équation compacte, interprétable et dimensionnellement cohérente. «

Dans le cadre de leur récente étude, les chercheurs ont testé leur cadre à la fois sur des données synthétiques générées par un grand modèle de langage (LLM) et sur des données astrophysiques réelles collectées par la NASA.

En fin de compte, ils ont pu dériver des formules décrivant les relations physiques dans les données liées à cinq scénarios réels de physique spatiale. Notamment, les formules dérivées correspondaient à celles dérivées par les physiciens humains ou semblaient représenter les données encore mieux.

Par exemple, lors de l’analyse des données publiées par la NASA en 1993, le modèle a abouti à une formule améliorée expliquant mathématiquement les cycles solaires. De plus, il a pu représenter efficacement les relations entre le rayonnement solaire, la température et les champs magnétiques.

Un outil prometteur pour la découverte scientifique

Essentiellement, le nouveau modèle d’IA développé par cette équipe de recherche apprend à décomposer des problèmes de physique complexes en parties plus simples. S'appuyant sur des équations existantes et bien établies, il peut ensuite générer de nouvelles formules décrivant efficacement la relation entre différentes variables.

« Bien qu'il soit trivial d'écrire une expression longue qui interpole les données, et qu'il soit tentant de privilégier les expressions très courtes, aucune des deux ne garantit la signification physique – de nombreuses formules candidates violent même la cohérence dimensionnelle (unité) », a déclaré Zhou.

« Nous exploitons les progrès récents dans les grands modèles de langage pour apprendre une a priori sur des équations cohérentes avec des unités connues, puis l'affiner afin que le système propose des expressions compactes et physiquement plausibles qui contiennent de véritables informations. Nous considérons cela comme une première étape vers l'abstraction et l'extension de l'expérience scientifique pour permettre une découverte automatisée. «

PhyE2E pourrait bientôt être utilisé pour analyser d’autres données expérimentales et astrophysiques, ce qui pourrait donner lieu à des formules décrivant mieux des phénomènes ou interactions physiques spécifiques. À l’avenir, elle pourrait également être adaptée et appliquée à d’autres disciplines, contribuant ainsi potentiellement à la découverte scientifique dans divers domaines.

« Nous étendons maintenant le cadre aux opérateurs sensibles au calcul (par exemple, les dérivées/intégrales pour les lois de type PDE), renforçant ainsi la robustesse des données de laboratoire plus bruyantes », a ajouté Zhou.

« Plus largement, l'objectif central de notre recherche est de faire progresser la méthodologie neuro-symbolique afin que les prédictions des réseaux neuronaux profonds soient interprétables. Dans le même temps, nous espérons que l'intégration de l'explicabilité comme principe de conception pourra améliorer la capacité d'un système d'IA à découvrir des lois scientifiques plus précises et plus fiables. »

Écrit pour vous par notre auteur Ingrid Fadelli, édité par Sadie Harley, et vérifié et révisé par Robert Egan, cet article est le résultat d'un travail humain minutieux. Nous comptons sur des lecteurs comme vous pour maintenir en vie le journalisme scientifique indépendant. Si ce reporting vous intéresse, pensez à faire un don (surtout mensuel). Vous obtiendrez un sans publicité compte en guise de remerciement.

Un nouveau cadre d'IA peut découvrir des équations de physique spatiale dans les données brutes

Un modèle qui représente symboliquement les données physiques

Un outil prometteur pour la découverte scientifique

Les perspectives d’un courant océanique régulateur du climat ne sont… pas bonnes

Les oiseaux de mer n'ont pas été trompés par une bouée en forme d'épouvantail aux yeux rotatifs

Le dépistage du diabète de type 1 chez tous les enfants peut détecter plus de cas plus tôt

Comment la conception des maisons peut lutter contre les maladies infantiles en Afrique

Le Congo se prépare à affronter Ebola. Aujourd’hui, une souche rare révèle des lacunes dans l’état de préparation

Pourquoi les catalyseurs prometteurs de transformation du CO₂ en carburant restent en deçà du cuivre

La pollution radioactive hante toujours Hunters Point à San Francisco

Un essai laser à l'ESO ouvre une nouvelle ère de l'interférométrie

Le rôle des e-mails professionnels dans les entreprises

Vivre sans compte bancaire : est-ce vraiment possible en France ?

Compte bancaire ado : quels gestes adopter en tant que parents ?

L’assurance vie est-il un placement sans risque ?

Réussir sa reconversion professionnelle en communication grâce à la formation en ligne

Le coliving : vers une nouvelle manière d’habiter plus écologique

Mindy Kaling partage sa devise avec la famille royale

Les perspectives d’un courant océanique régulateur du climat ne sont… pas bonnes

Jonathan Andic, fils aîné du fondateur de la chaîne de mode Mango, arrêté pour la mort de son père

Donald Trump Jr. et Bettina Anderson célèbrent leur mariage lors d'une cérémonie de mariage aux Bahamas

Comment je lutte avec l'héritage compliqué de Miles Davis en tant qu'artiste et agresseur

Les oiseaux de mer n'ont pas été trompés par une bouée en forme d'épouvantail aux yeux rotatifs

Le dépistage du diabète de type 1 chez tous les enfants peut détecter plus de cas plus tôt

Le classement définitif des célébrités des New York Knicks

Comment la conception des maisons peut lutter contre les maladies infantiles en Afrique

La prolifération des algues de l’Atlantique pourrait être prévisible, ouvrant la voie à l’élimination du carbone et aux biocarburants

Charles Spencer, le frère de la princesse Diana, épouse sa quatrième femme en Arizona

Le Congo se prépare à affronter Ebola. Aujourd’hui, une souche rare révèle des lacunes dans l’état de préparation

Pourquoi les catalyseurs prometteurs de transformation du CO₂ en carburant restent en deçà du cuivre

Un modèle qui représente symboliquement les données physiques

Un outil prometteur pour la découverte scientifique

Avant de partir, restons en contact !