Les outils d'IA transforment la façon dont nous observons le monde qui nous entoure – et même les étoiles au-delà. Récemment, une équipe internationale a prouvé que les techniques d'apprentissage en profondeur et les grands modèles de langage peuvent aider les astronomes à classer les étoiles avec une grande précision et une efficacité. Leur étude, «Deep Learning and Methods Based sur de grands modèles de langage appliqués à la classification stellaire de la courbe de lumière», a été publié le 26 février Informatique intelligente.
L'équipe a présenté la série Starwhisper Lightcurve, un trio de modèles AI, et a évalué ses performances aux côtés d'autres approches de pointe. Tous les modèles ont été formés pour classer les étoiles variables de leurs courbes de lumière avec un apprentissage en profondeur automatisé, ce qui permet l'optimisation automatique de facteurs clés tels que le taux d'apprentissage, la taille du lot et la complexité du modèle, minimisant le besoin de réglage manuel.
L'équipe a obtenu des données de formation des missions Kepler et K2 de la NASA, en se concentrant sur cinq types principaux d'étoiles variables. Un petit nombre d'étoiles variables rares ont également été incluses pour améliorer la généralisation du modèle.
L'évaluation complète montre une précision élevée de classification entre différentes architectures d'IA pour les principaux types d'étoiles variables. Parmi les modèles les plus performants, le modèle CONV1D + BILSTM – une approche hybride en profondeur combinant des couches convolutionnelles pour l'extraction de caractéristiques et les couches récurrentes pour les modèles temporels – a été affichée à 94% de précision. Le modèle Swin Transformer, une variante de l'architecture de transformateur populaire développée à l'origine pour le traitement du langage naturel, a atteint une précision de 99%.
Notamment, le transformateur SWIN a démontré une précision de 83% dans l'identification des étoiles Cepheid de type II, une rare classe d'étoiles pulsantes qui ne représentent que 0,02% de l'ensemble de données.
Bien que le transformateur SWIN offre une précision impressionnante, elle nécessite un prétraitement supplémentaire pour convertir les données de courbe lumineuse en images. En revanche, Starwhisper LightCurve a atteint une précision de près de 90% avec une intervention manuelle minimale, réduisant le besoin d'ingénierie des fonctionnalités explicites. Cette efficacité rationalise non seulement le traitement des données, mais ouvre également la voie à l'analyse des données parallèles et à l'avancement des applications d'IA multimodales en astronomie.
La série Starwhisper LightCurve se compose de trois modèles spécialisés en grande langue, chacun réglé pour un format de données astronomiques différent:
- Un grand modèle de langue, construit sur Gemini 7b, pour classer les courbes de lumière comme texte de séries chronologiques structurées.
- Un modèle multimodal de grande langue, construit sur Deepseek-VL-7B-CHAT, pour le traitement des représentations de courbes lumineuses basées sur l'image.
- Un grand modèle de langue audio, construit sur Qwen-Audio, pour convertir les courbes de lumière en ondes sonores.
La série Starwhisper Lightcurve fait partie du projet plus large de Starwhisper, un modèle de grande langue conçu pour l'astronomie avec de solides capacités de raisonnement et de suivi des instructions.


