in

Partager les scores de risque génétique peut involontairement révéler des secrets

Partager les scores de risque génétique peut involontairement révéler des secrets

Les statistiques qui quantifient la prédisposition d'une personne à des maladies telles que le diabète et le cancer peuvent être rétro-conçues pour révéler les données génétiques sous-jacentes, suscitant ainsi des problèmes de confidentialité.

Partager les scores de risque génétique peut involontairement révéler des secrets

Les données génétiques peuvent être analysées pour estimer votre risque de certaines conditions

Les scores de risque génétique qui résument la probabilité qu'une personne souffre de certains problèmes de santé peuvent être exploités grâce à des astuces mathématiques pour révéler des détails cachés sur son ADN.

La méthode pourrait théoriquement être utilisée par les assureurs maladie pour reconstruire des données génétiques à partir d'un rapport génomique synthétique, révélant des risques sanitaires non divulgués par le patient. Alternativement, les personnes partageant leurs scores de manière anonyme pourraient être identifiées en extrayant les données génétiques et en interrogeant les bases de données généalogiques publiques.

Les scores de risque polygénique mesurent l’impact de dizaines, voire de milliers de variations de lettres individuelles dans le génome, connues sous le nom de polymorphismes mononucléotidiques (SNP). Utilisés par les chercheurs et les sociétés de tests ADN pour résumer les risques potentiels pour la santé, les scores sont parfois partagés publiquement, par exemple par des personnes demandant des conseils sur l'interprétation de leurs scores.

Décomposer un score de risque polygénique, c'est comme essayer de calculer un numéro de téléphone en sachant seulement que la somme des chiffres donne 52. C'est un exemple du problème du sac à dos en mathématiques, connu pour être difficile en termes de calcul. Pour cette raison, les scores sont considérés comme un faible risque pour la vie privée.

Cependant, chaque valeur SNP utilisée dans un score de risque est multipliée par un poids extrêmement précis (jusqu'à 16 chiffres) qui reflète sa contribution au risque global de maladie. Cela rend les modèles à faible risque vulnérables aux attaques.

« Comme le score final de risque polygénique est limité par un nombre fini de façons d'arriver à ce nombre et par un arrangement statistiquement probable des SNP sous-jacents, il peut être déduit avec un haut degré de précision », explique Gamze Gürsoy de l'Université Columbia à New York.

Gürsoy et Kirill Nikitin, également à Columbia, ont exécuté 298 modèles de risque polygénique utilisant 50 SNP ou moins sur les données génétiques de 2 353 individus. En travaillant à rebours, ils ont calculé tous les génomes possibles qui auraient pu produire chaque score donné, en filtrant ceux présentant de nombreuses mutations inhabituelles.

Comme un SNP peut être utilisé par plusieurs modèles de risque polygéniques, Gürsoy et Nikitin ont pu connecter leur attaque en série, en utilisant les SNP révélés par des modèles plus petits pour aider à résoudre les plus grands.

Ils ont pu reconstruire le génotype du donneur avec une précision de 94,6 pour cent, prédisant correctement 2 450 SNP par individu. Les tests ont montré que 27 SNP suffisaient pour identifier un individu dans un pool d'un demi-million d'échantillons, et que les membres de la famille pouvaient être prédits avec une précision allant jusqu'à 90 %. Les individus d'origine africaine et est-asiatique ont été plus facilement identifiés car ils sont moins bien représentés dans les bases de données génétiques.

Selon Gürsoy, 447 petits modèles de haute précision contenus dans une base de données publique de scores polygéniques sont vulnérables à cette attaque.

«Nous voulions souligner que le risque est faible, mais que dans (certaines conditions), il peut quand même y avoir des fuites», explique Gürsoy. « Nous devrions en tenir compte lors de la conception d’études de recherche, surtout si nous impliquons des populations vulnérables. »

Ying Wang du Massachusetts General Hospital affirme que les protections des données existantes et les goulots d'étranglement informatiques limitent le risque que les scores de risque polygénique soient exploités de cette manière. « Les résultats peuvent servir d'avertissement quant au fait que les petits modèles doivent être traités comme des données potentiellement sensibles dans les rapports cliniques et les discussions sur le consentement éclairé », dit-elle.

L'histoire de Charvet (ou comment garder le luxe silencieux)

L'histoire de Charvet (ou comment garder le luxe silencieux)

Le réchauffement des eaux côtières apparaît comme le principal facteur de vagues de chaleur humide à grande échelle