DeePFAS, un nouveau modèle d'apprentissage en profondeur, rationalise le criblage non ciblé à grande échelle des « produits chimiques éternels » (PFAS) en projetant des spectres MS2 bruts dans un espace latent de caractéristiques chimiques, offrant ainsi une solution rapide, basée sur l'IA, pour remplacer l'analyse traditionnelle complexe.
La détection précise des substances per- et polyfluoroalkyles (PFAS), souvent appelées « produits chimiques éternels », présente un défi critique et complexe pour les sciences de l'environnement en raison de leur diversité structurelle, du manque de méthodes standardisées et de la nécessité d'équipements très sensibles pour mesurer les niveaux de traces dans l'environnement.
Une étude publiée dans Sciences et technologies environnementales révèle une approche innovante basée sur l’apprentissage profond pour surmonter ces obstacles. La prévalence de la contamination de fond et le grand nombre de composés PFAS distincts compliquent encore davantage le développement de protocoles de détection universels.
La méthodologie analytique actuelle repose principalement sur la chromatographie liquide – spectrométrie de masse à haute résolution (LC-HRMS), largement adoptée pour analyser les PFAS dans diverses matrices (eau, sol, échantillons biologiques, etc.).
Cependant, LC-HRMS présente des défis importants, notamment un risque de contamination élevé, une préparation des échantillons exigeante en main-d'œuvre et un traitement des données fastidieux. Ce traitement nécessite des logiciels et une expertise avancés, notamment pour distinguer des composés structurellement similaires.
Pour remédier à ces limitations, une équipe de chercheurs de l’Université nationale de Taiwan a introduit DeePFAS, une nouvelle méthode d’apprentissage en profondeur pour l’annotation rapide et efficace des composés PFAS.
DeePFAS utilise un codeur spectral spécialisé, qui intègre des architectures convolutives et de transformateur, pour traduire les spectres MS2 bruts (empreintes chimiques) en un « espace latent ». Cet espace latent représente une cartographie concise des caractéristiques structurelles chimiques tirées d’un vaste corpus de composés non marqués.
En comparant ces représentations latentes avec des molécules candidates, DeePFAS permet une annotation très efficace des spectres MS2. Cette approche rationalise considérablement les efforts de dépistage non ciblés des PFAS à grande échelle et réduit la complexité analytique globale de la surveillance environnementale.
L'étude a démontré avec succès la sensibilité de DeePFAS dans l'identification des caractéristiques spécifiques aux PFAS, et sa faisabilité pratique a été confirmée par l'application à des échantillons d'eaux usées du monde réel.
L’équipe a reconnu des limitations mineures, notamment des annotations occasionnelles faussement positives associées à certains composés pour lesquels l’outil présentait une confiance moindre.
Les travaux futurs consisteront à élargir la bibliothèque d’empreintes chimiques à l’aide de méthodes in silico et à comparer les résultats de DeePFAS avec ceux des outils existants pour renforcer la confiance. En fin de compte, DeePFAS offre une solution d'IA robuste et open source pour les chercheurs et est disponible pour des recherches et développements ultérieurs sur GitHub.
« Cette approche est conçue pour améliorer l'analyse non ciblée des PFAS et réduire considérablement la complexité analytique », explique le professeur Yufeng Jane Tseng, auteur correspondant de l'étude.


