Il n'y a rien pour que le cœur d'un scientifique pompe comme un bon débat statistique à l'ancienne. En ce qui concerne les sujets comme trouver des analogues de la Terre ou des indices d'une biosignature dans une atmosphère, ces débats statistiques pourraient avoir des conséquences réelles, à la fois pour l'attribution de ressources d'observation supplémentaires, mais aussi pour la compréhension générale de l'humanité de lui-même dans l'univers.
Un nouveau journal publié sur le arxiv Un serveur préimprimé de deux chasseurs d'exoplanètes proéminents, David Kipping de Columbia et Björn Benneke de l'UCLA, soutient que leurs collègues dans le domaine de la détection des exoplanet ont fait des statistiques qui se trompent depuis des décennies et fait un argument sur la meilleure façon de présenter leurs résultats au public.
Bien que les statistiques puissent sembler une partie arcanique du processus global d'exploration spatiale, il est absolument essentiel pour l'avancement de la science. Il existe un phénomène (ou une planète) hors de l'ombre d'un doute nécessite que les données soutiennent une certaine «signification statistique». Il existe une formule mathématique pour cela, connue sous le nom de théorème de Bayes, mais aussi une compréhension humaine fondamentale, et la confusion semble être dans la façon de traduire les mathématiques en quelque chose que le public peut comprendre et accepter une découverte scientifique.
La traduction détaillée dans le document est entre les bayésiens (c'est-à-dire la probabilité que quelque chose se soit produit par rapport aux statistiques « fréquentistes » (c'est-à-dire à quel point il est surprenant que cela se soit produit). En termes fréquentistes, cela est communément appelé une valeur « Sigma » après la lettre grecque utilisée dans sa description mathématique. Et cette valeur sigma se trouve au cœur du conflit, selon le document.
Les valeurs Sigma ont acquis une importance pour son rôle en tant que partie de la découverte du boson de Higgs au grand collisionneur de hadrons en 2012.
Il existe une formule mathématique pour traduire les statistiques bayésiennes en statistiques fréquentistes, et la méthode généralement adoptée par les chasseurs d'exoplanet a été présentée dans un article en 2001 par un groupe de statisticiens. Un document de suivi de 2013, plus adapté aux besoins des chasseurs d'exoplanet spécifiquement (et co-écrit par l'un des auteurs du nouvel article – Dr. Benneke) a en outre cimenté l'utilisation de cette conversion dans la littérature académique. Cependant, une erreur typographique dans l'article de 2013 aurait pu contribuer à une mauvaise interprétation de l'importance des statistiques – elle a mentionné « au moins » une valeur sigma, alors qu'elle aurait dû dire « tout au plus ».
Quelle que soit la cause de la déconnexion, les auteurs soutiennent que, depuis les premiers jours de la chasse aux exoplanet, ses praticiens représentaient à tort la probabilité de leurs découvertes en mal déterminant le facteur de conversion du bayésien en langue fréquente. Un exemple particulier qu'ils notent est la détection récente (certes déjà controversée) du sulfure de diméthyle (DMS) dans l'atmosphère de l'exoplanet K2-18B. Ils soutiennent, étant donné les limites des facteurs de Bayes, que le titre du document présentant des preuves de cette conclusion aurait dû dire « moins de 3 sigma ».
Bien que cela puisse sembler être un jonction mineur, une partie du point est de démontrer que la signification pourrait être nettement moins de trois sigma, remettant en question toute la constatation pour commencer. Ce n'est peut-être pas le cas pour cette conclusion particulière, mais la méthodologie statistique bâclée pourrait conduire à des résultats confus à l'avenir.
Alors que faire? Il existe plusieurs méthodes statistiques plus rigoureuses à convertir entre les statistiques bayésiennes et fréquentistes, mais aux auteurs, il est beaucoup plus facile d'utiliser eux-mêmes les facteurs bayésiens. La prémisse selon laquelle le public n'est pas habitué à leur utilisation n'est pas vraie – la crédibilité utilise traditionnellement les facteurs bayésiens, bien qu'ils soient décrits comme des «cotes» dans cette langue.
Si les scientifiques des exoplanet commencent à utiliser cette langue familière, leurs résultats seront peut-être plus largement acceptés. Ou peut-être qu'un autre camp ou rival Exoplanet Hunters publiera un article de journal rempli de mèmes sur la nécessité de statistiques fréquentistes. Quoi qu'il en soit, la science continuera de progresser avec la collecte de données supplémentaires, et il y aura des débats sur ce que ces données signifient tant qu'il y aura des scientifiques pour en discuter.


