À une époque où les données sont complexes, les scientifiques sont de plus en plus confrontés à des informations qui ne sont pas pertinentes.’t reposent parfaitement sur des surfaces plates et euclidiennes. Des scans médicaux 3D aux orientations des robots et aux transformations de l'IA, une grande partie de l'actualité’Les données se trouvent sur des espaces géométriques courbes, appelés variétés riemanniennes. L'analyse précise de ces données reste un défi, en particulier lorsque le bruit ou les valeurs aberrantes faussent les résultats.
Pour résoudre ce problème, le professeur Jongmin Lee du département de statistiques de l'université nationale de Pusan, en collaboration avec le professeur Sungkyu Jung de l'université nationale de Séoul, a développé une nouvelle méthode statistique appelée moyenne de Huber, conçue pour rendre l'analyse des données sur les espaces courbes plus robuste et plus fiable. L'étude, publiée dans le Journal de la Royal Statistical Society Série B : Méthodologie statistique le 25 août 2025, introduit une généralisation robuste de la moyenne classique de Fréchet en intégrant la fonction de perte de Huber, combinant efficacité et résistance aux valeurs aberrantes dans un cadre élégant.
« Notre étude introduit une généralisation robuste de la moyenne classique de Fréchet sur les variétés riemanniennes », a déclaré Lee. « Cela offre une plus grande stabilité contre les valeurs aberrantes et améliore la fiabilité de l'analyse statistique des données géométriques. »
La moyenne de Huber s'adapte automatiquement à la structure des données, en utilisant la perte L₂ (moindres carrés) pour les observations typiques et la perte L₁ (écart absolu) pour les grands écarts. Cet équilibre lui permet d'atteindre un point de rupture de 0,5, ce qui signifie que l'estimateur reste fiable même si la moitié des données sont des valeurs aberrantes ou extrêmes. L'étude fournit également des garanties théoriques quant à l'existence, l'unicité, la convergence et l'impartialité de l'estimateur, ainsi qu'un nouvel algorithme de calcul qui converge rapidement dans la pratique.
« Cette méthode permet une analyse de données plus robuste dans des contextes non euclidiens, ce qui présente des applications potentielles dans des domaines tels que la vision par ordinateur, l'imagerie médicale et l'analyse de forme », a expliqué Lee.
Ces applications s'étendent à tous les domaines scientifiques et techniques. En imagerie médicale, la moyenne de Huber pourrait améliorer la moyenne des données sur la forme du cerveau ou des organes, conduisant ainsi à des diagnostics plus précis. En robotique, cela pourrait aider les systèmes à mieux interpréter les données de mouvement et d’orientation, même dans des environnements bruyants ou imprévisibles. Dans l’IA et l’apprentissage automatique, cela pourrait rendre les modèles fonctionnant sur des données géométriques (rotations, graphiques ou transformations liés) plus résilients et plus équitables.
Lee a ajouté : « En fournissant une base pour une analyse de données robuste et géométriquement consciente, cette recherche pourrait tranquillement soutenir la prochaine génération d'IA fiable, de médecine de précision et de technologies intelligentes qui interagissent avec le monde réel. »


