Cette IA open source peut détecter les mutations cancéreuses

Un nouveau modèle d’intelligence artificielle open source pourrait accélérer la médecine de précision. Baptisé DeepSomatic, il permet d’identifier les mutations génétiques responsables de cancers avec une précision jamais atteinte, en exploitant les dernières avancées du séquençage à haut débit. L’IA a été dévoilée au sein de Google Research.

Contrairement aux outils classiques, DeepSomatic ne se limite pas à comparer des génomes à la recherche d’anomalies ponctuelles : il apprend à reconnaître les signatures complexes des mutations somatiques, celles acquises au cours de la vie et à l’origine du développement tumoral. Testé sur six lignées cellulaires de cancers du sein et du poumon, il a détecté 329 000 variantes génétiques, surpassant nettement les logiciels d’analyse existants. Sur les données de séquençage Illumina, son score F1 atteint 90 % pour la détection des insertions et délétions — contre 80 % pour les meilleurs outils concurrents — et plus de 80 % sur les longues lectures PacBio, là où les autres tombent sous les 50 %.

Les chercheurs à l’origine du projet, dont Kishwar Shafin, responsable technique, et Andrew Carroll, responsable produit, expliquent que DeepSomatic s’appuie sur des réseaux de neurones convolutifs capables de traiter les données de séquençage comme des images.

Cette approche permet au modèle de distinguer les variations réelles des artefacts introduits lors du séquençage. Publiée dans Nature Biotechnology, l’étude montre que l’outil peut s’adapter à des types de cancers qui n’ont pas été inclus dans son entraînement initial, notamment la leucémie pédiatrique et le glioblastome, une forme agressive de tumeur cérébrale. Dans les échantillons de leucémie infantile, DeepSomatic a même révélé dix mutations jusqu’alors inconnues.

Le modèle, annoncé il y a quelques jours, est accompagné d’un ensemble de données d’entraînement de référence, CASTLE (Cancer Standards Long-read Evaluation), combinant des données issues de trois technologies majeures — Illumina, PacBio et Oxford Nanopore — pour éliminer les erreurs propres à chaque plateforme. Cet effort de standardisation vise à fournir une base commune et vérifiable pour l’analyse génétique du cancer.

Les chercheurs espèrent que DeepSomatic contribuera à affiner le diagnostic moléculaire et à guider les traitements personnalisés, en rendant la détection des mutations plus fiable, même à partir d’échantillons anciens ou dégradés. L’outil est publié sous licence BSD-3 et son code est accessible sur GitHub.

Retour en haut