Les chercheurs de Rice University ont développé un nouvel algorithme d'apprentissage automatique (ML) qui excelle dans l'interprétation des « signatures légères » (spectres optiques) des molécules, des matériaux et des biomarqueurs de la maladie, permettant potentiellement des diagnostics médicaux plus rapides et plus précis et une analyse des échantillons.
« Imaginez pouvoir détecter les premiers signes de maladies comme la maladie d'Alzheimer ou le Covid-19 juste en éclairant une goutte de liquide ou un échantillon de tissu », a déclaré Ziyang Wang, un doctorant en génie électrique et informatique chez Rice qui est un premier auteur sur une étude publiée dans l'électricité et le génie informatique Nano ACS. « Notre travail rend cela possible en enseignant aux ordinateurs comment mieux lire 'le signal de la lumière dispersée à partir de minuscules molécules. »
Chaque matériau ou molécule interagit avec la lumière d'une manière unique, produisant un motif distinct, comme une empreinte digitale. La spectroscopie optique, qui implique de briller un laser sur un matériau pour observer comment la lumière interagit avec elle, est largement utilisée en chimie, en science des matériaux et en médecine. Cependant, l'interprétation des données spectrales peut être difficile et longue, en particulier lorsque les différences entre les échantillons sont subtiles. Le nouvel algorithme, appelé régression logistique élastique élastique sensible au pic (PSE-LR), est spécialement conçu pour analyser les données basées sur la lumière.
« Les spectres optiques d'un tissu ou d'un autre échantillon biologique peuvent en révéler beaucoup sur ce qui se passe à l'intérieur du corps », a déclaré Wang. « Cela est important car la détection des maladies plus rapide et plus précise peut conduire à de meilleurs traitements et sauver des vies. Au-delà de la santé, notre méthode peut également aider les scientifiques à comprendre de nouveaux matériaux, conduisant à des capteurs plus intelligents et à des dispositifs de diagnostic plus petits. »
PSE-LR peut non seulement classer avec précision différents échantillons, mais est également transparent dans sa prise de décision – quelque chose que de nombreux modèles ML avancés ne sont pas particulièrement bons. PSE-LR fournit une « carte d'importance des fonctionnalités » qui met en évidence exactement les parties du spectre qui ont contribué à une décision de classification, ce qui rend les résultats plus faciles à interpréter, vérifier et agir.
« Notre algorithme a été conçu pour se concentrer sur les parties les plus importantes du signal; les pics qui comptent le plus », a déclaré Wang, en comparant PSE-LR à « un détective apprenant à trouver des indices cachés dans les signaux légers ».

Les chercheurs ont testé PSE-LR contre d'autres modèles ML, montrant des performances améliorées, en particulier dans l'identification des caractéristiques spectrales subtiles ou qui se chevauchent.
« La plupart des modèles manquent les minuscules détails ou sont trop complexes pour comprendre », a déclaré Wang. « Nous avons cherché à résoudre ce problème en construisant quelque chose de intelligent et d'explicable. »
Le modèle a également bien fonctionné dans une gamme de tests à évaluer son sens du monde réel, notamment en détectant des concentrations ultralores de la protéine de pointe SARS-COV-2 dans des échantillons de liquide, en identifiant des solutions neuroprotectrices dans les tissus cérébraux de la souris, en classant les échantillons de maladie de la maladie de la Alzheimer et en distinguant entre les semi-conducteurs 2D.
« Notre outil est capable d'analyser les données basées sur la lumière pour des signaux très subtils qui sont généralement difficiles à reprendre en utilisant des méthodes traditionnelles », a déclaré Shengxi Huang, professeur agrégé de génie électrique et informatique et de science des matériaux et de nano-ingénieurs qui est un auteur correspondant à l'étude.
Le nouvel algorithme pourrait permettre le développement de nouveaux diagnostics, biocapteurs ou nanodévices.
« Ces résultats pourraient aider à transformer les diagnostics médicaux et la science des matériaux, nous rapprochant d'un monde où les technologies intelligentes aident à détecter et à répondre aux problèmes de santé plus rapidement et plus efficacement », a déclaré Wang.


