Champ de fleurs jaunes au coucher de soleil avec la mention "Imagine a World Without Cancer", visuel du Johns Hopkins Kimmel Cancer Center

Johns Hopkins publie AstroID, une base de données open source pour unifier les données de recherche sur le cancer

Un milliard de cellules cancéreuses cartographiées, 16 cohortes de patients, des dizaines de types de tumeurs : c’est ce que le Johns Hopkins Kimmel Cancer Center a déjà engrangé en Australie dans AstroID, sa nouvelle base de données open source publiée sur GitHub.

L’outil, décrit dans le Journal for Immunotherapy of Cancer le 25 décembre 2025, vise à mettre fin à l’un des problèmes les plus chronophages de la recherche en oncologie : la recompilation manuelle des données patients à chaque nouvelle étude.

L’annonce du 4 mars précise qu’AstroID organise les informations cliniques et biologiques en six couches : données patient (dépersonnalisées), diagnostic, événements cliniques (traitements, prises de sang), échantillons, détails de traitement en laboratoire, et enfin lames ou aliquotes individuelles. Construit sur REDCap, une application web de recherche largement utilisée, le tout peut être exporté en SQL et fusionné avec des ensembles de données de biomarqueurs aussi vastes que nécessaire.

« Ce que cette structure permet, c’est de poser des questions sur l’ensemble des données déjà collectées, à travers différents types de tumeurs, et de tout combiner dans le contexte de l’expérience longitudinale du patient« , explique Janis M. Taube, co-directrice du Tumor Microenvironment Laboratory au Bloomberg~Kimmel Institute for Cancer Immunotherapy.

De quelques dizaines à des milliers de patients

Jusqu’ici, la lourdeur de la saisie manuelle contraignait les études oncologiques à de petites cohortes. Chaque nouvelle investigation obligeait à recompiler depuis zéro les informations sur les traitements reçus, les prélèvements effectués, les résultats cliniques. « Ce que nous essayons de faire, c’est de monter en puissance pour pouvoir gérer des études portant sur des centaines, voire des milliers de patients« , résume Alexander Szalay, directeur de l’Institute for Data Intensive Science à Johns Hopkins.

L’équipe précise qu’AstroID pourrait être adapté bien au-delà du cancer, pour caractériser des bioéchantillons longitudinaux dans d’autres processus pathologiques, voire dans le vieillissement normal.

Le code source est disponible sur github.com/AstroPathJHU/AstroID, et le module REDCap associé sur github.com/IUREDCap/redcap-etl-module.

Retour en haut