Lorsque j'ai commencé à travailler avec des données de spectroscopie de champ intégrale (IFU), j'ai été frappé par la complexité en moyenne ou masquée par des techniques de traitement traditionnelles. La plupart des méthodes de segmentation de l'astronomie – en particulier celles conçues pour les cubes de données de l'IFU – se réduisent soit sur des composants morphologiques prédéfinis, soit sur une heuristique signal à bruit. Parmi les plus courants figure Voronoi Binning, qui priorise le rapport signal / bruit au détriment de la préservation de la variation spectrale sous-jacente.
J'ai commencé à explorer un chemin alternatif: au lieu d'appliquer des modèles morphologiques prédéfinis ou de m'appuyer sur des techniques de signal / bruit comme le binning Voronoi – qui est souvent obscur la diversité spectrale – je voulais voir ce qui se passerait si nous laissions les spectres eux-mêmes définir la structure.
Cette motivation a conduit à Capivara, un algorithme de segmentation non supervisé qui regroupe les régions d'une galaxie en fonction de leur similitude spectrale complète. Il ne suppose pas à quoi ressemble une structure « devrait » – aucun modèle antérieur, pas de géométrie imposée. Au lieu de cela, il regroupe les régions dont les spectres sont identiques, permettant aux données de guider la segmentation.
Nous avons appliqué Capivara aux galaxies de l'enquête sur les mangas, et sans intervention manuelle ou entraînement supervisé, l'algorithme a réussi à délimiter les structures physiquement cohérentes – y compris les queues de marée, les barres, les anneaux, les bras en spirale et même les étoiles de premier plan. Ces caractéristiques ont émergé naturellement des corrélations spectrales, plutôt que des seuils de proximité spatiale ou de luminosité.
Techniquement, Capivara est conçue pour l'évolutivité. Il utilise le clustering spectral implémenté avec l'accélération des torche et GPU, ce qui le rend efficace pour les ensembles de données IFU modernes qui peuvent contenir des dizaines ou des centaines de milliers de spectres par galaxie. Surtout, Capivara évite la moyenne spectrale inhérente dans de nombreuses approches de binning – une caractéristique critique lors de l'étude de processus subtils tels que les gradients de métallicité, les fronts de choc ou la structure d'ionisation.

Notre objectif n'était pas de remplacer les outils existants, mais de fournir un cadre complémentaire – celui qui maintient l'intégrité spectrale et prend en charge les sciences exploratoires basées sur les données. Les sorties Capivara comprennent des centroïdes de cluster, des scores de confiance et des masques qui s'intègrent facilement aux pipelines d'analyse existants.
Le logiciel est open-source et disponible sous une licence MIT sur GitHub. La méthodologie complète et les résultats sont décrits dans notre nouvel article publié dans Avis mensuels de la Royal Astronomical Society.
En fin de compte, Capivara reflète un changement dans la façon dont nous abordons l'analyse de la galaxie. Plutôt que d'ajuster les données à nos attentes, nous permettons aux données de révéler sa propre structure et, ce faisant, de découvrir des fonctionnalités qui pourraient autrement rester cachées.
Cette histoire fait partie de Science X Dialog, où les chercheurs peuvent signaler les résultats de leurs articles de recherche publiés. Visitez cette page pour plus d'informations sur la boîte de dialogue Science X et comment participer.
Son livre Bayesian Models for Astrophysical Data (Cambridge University Press, 2017) a reçu le prix Prose du meilleur livre en cosmologie et en astronomie. Rafael a également servi trois conditions consécutives en tant que vice-présidente de l'International Astrostatistics Association.


