L'analyse informatique des données géospatiales pourrait être rendue plus respectueuse de l'environnement grâce à un nouveau modèle de logiciel révolutionnaire construit par une équipe de scientifiques d'une université écossaise.
Des chercheurs de l'Université de Glasgow sont à l'origine du développement du modèle, appelé «géoagregator», qui exploite la puissance de l'apprentissage automatique pour réduire les exigences de calcul de l'analyse des ensembles de données géospatiales complexes. L'article de l'équipe, intitulé « GeoAngregator – Un modèle de transformateur efficace pour les données tabulaires géo-spatiales » sera présentée à la conférence AAAI sur l'intelligence artificielle cette semaine.
À mesure que la technologie GPS et les données par satellite deviennent plus répandues, des quantités massives d'informations géospatiales sont collectées quotidiennement. Cependant, donner un sens à ces données nécessite des techniques de modélisation sophistiquées qui capturent des relations spatiales complexes – quelque chose que les méthodes statistiques traditionnelles et même les modèles d'IA existants ont du mal.
Le géoagrégateur relève ces défis en introduisant un modèle d'IA basé sur un transformateur léger qui analyse efficacement l'autocorrélation spatiale (comment les lieux voisins s'influencent mutuellement) et l'hétérogénéité spatiale (comment les modèles varient d'un endroit à un autre). Contrairement aux modèles conventionnels d'apprentissage en profondeur qui exigent d'énormes quantités de puissance de calcul, le géoaggréteur est plus rapide, plus évolutif et nécessite moins de ressources, ce qui le rend plus accessible aux chercheurs et aux décideurs.
L'une des principales innovations de GeoAggregator est son mécanisme d'attention local biaisé par le Gaussan, qui aide le modèle à se concentrer sur les points de données à proximité pertinents tout en considérant le contexte spatial plus large. Cette approche améliore les prédictions pour une variété de problèmes de données spatiales, tels que la prévision des niveaux de pollution atmosphérique, l'identification des tendances des prix du logement et l'analyse de la distribution de la pauvreté.
Une autre percée est son mécanisme d'attention cartésien, qui maintient le modèle léger tout en maintenant une grande précision. Cela signifie que même à mesure que les ensembles de données s'agrandissent, les géoaggréteurs peuvent les traiter efficacement – quelque chose avec lequel de nombreux modèles d'IA traditionnels ont du mal.
Pour tester son efficacité, les chercheurs ont comparé le géoagrégateur avec des techniques de modélisation géospatiale largement utilisées, notamment des méthodes géostatistiques, des modèles XGBOost et Deep Learning. Les résultats ont montré que le géoagrégateur a régulièrement effectué ainsi que ou mieux que ses concurrents dans différents ensembles de données, y compris les données synthétiques, les prévisions de prix du logement et les évaluations de la qualité de l'air.
Surtout, le modèle a obtenu une précision élevée tout en utilisant beaucoup moins de ressources de calcul, ce qui en fait une solution pratique pour les applications du monde réel où la vitesse et l'efficacité comptent.
Les chercheurs ont créé leur code ouvert, encourageant les autres à l'utiliser et à l'améliorer. À mesure que l'intérêt pour les données basées sur la localisation augmente, des outils tels que les géoagrégateurs peuvent aider à transformer les informations géospatiales complexes en informations utiles sur la façon dont les personnes et les emplacements interagissent.
Le Dr Mingshu Wang, de l'école des sciences géographiques et de la terre de l'Université de Glasgow, est l'un des co-auteurs du journal. Il a déclaré: « La majorité des données sont de nature géographique, bien que nous négligeons souvent ce fait. Des transactions immobilières aux achats d'épicerie et aux données commerciales, si elles ont un emplacement joint, ce sont des données géographiques, et elles peuvent être utilisées pour aider Guide les décisions à travers un large éventail d'applications de l'échelle du quartier vers le monde entier.
« Le géoagrégateur représente un grand pas en avant pour rendre l'analyse des données complexe plus efficace et plus accessible à tout le monde. Toute l'analyse des données que nous avons faite lors du développement du géoagrégateur a été effectuée sur un seul ordinateur portable, ce qui montre à quel point il s'agit d'un outil efficace.
« De nombreuses industries s'appuient sur la compréhension des relations spatiales pour faire des prédictions et planifier l'avenir. Avec les géoagrégateurs, les organisations peuvent analyser plus efficacement les données spatiales, aider à façonner de meilleures politiques, à améliorer la planification urbaine et à soutenir le développement durable. »
Les chercheurs développent actuellement un package Python open source qui rendra le modèle disponible librement pour quiconque souhaite l'utiliser. Cette évolution fait partie du doctorat en cours. Des recherches de Rui Deng, qui continueront d'améliorer les capacités du modèle au cours des deux prochaines années.
M. Deng, qui est l'auteur principal du journal, a déclaré: « Pour les petites et moyennes entreprises, les chercheurs ou les fins d'enseignement où les ressources sont limitées, l'agrégateur fournit un moyen d'obtenir une analyse des données très précise tout en maintenant l'efficacité. Même pour plus Les organisations dotées de ressources informatiques illimitées, le choix d'un modèle plus efficace comme celui-ci pourraient stimuler leurs efforts pour atteindre la durabilité grâce à une réduction de la consommation d'énergie et d'eau. «
Le Dr Ziqi Li, professeur adjoint à la Florida State University, est un chercheur honoraire et co-superviseur de Deng à la School of Geographical & Earth Sciences, est également co-auteur de l'article.
La recherche fait partie de l'expertise multidisciplinaire élargie de l'Université de Glasgow dans l'intelligence artificielle et l'apprentissage automatique, après le lancement du Center for Data Science & AI en septembre 2023.
En partenariat avec des partenaires du monde universitaire, de l'industrie et du gouvernement, Exageo entraînera 65 nouveaux doctorants. Les étudiants ayant des compétences pour développer et appliquer un logiciel pour les applications environnementales qui fonctionneront sur des systèmes informatiques exascale de nouvelle génération.


