La Unidad de Ingeniería de Datos para la Investigación trabaja en la digitalización y estandarización de datos, colaborando estrechamente con diferentes grupos de investigación dentro de la institución. Además de participar activamente en proyectos de investigación, la unidad se dedica a crear y mantener un entorno e infraestructura sólida para el almacenaje y la gestión de datos a nivel institucional.
La unidad trabaja con una amplia variedad de datos, que incluyen información clínica, genómica, imágenes y otras fuentes biomédicas, con el objetivo de maximizar su explotación y potenciar su uso en la investigación, proporcionando a los investigadores/as las herramientas necesarias para ello. Asimismo, ofrece soporte en la definición de los Data Management Plan (DMP), documentos en los que se especifica el uso y flujo de datos de un proyecto. A través del desarrollo de procesos ETL (Extracción, Transformación y Carga), la creación de bases de datos estructuradas, la integración de datos provenientes de diversas fuentes, y el desarrollo y gestión de software especializado, se proporciona una infraestructura robusta que permite a los investigadores explotar al máximo el valor de los datos generados.
Anna Pedrola
Jefa de la Unidad
Biosketch
- Estandarización de datos clínicos bajo el modelo OMOP (Observational Medical Outcomes Partnership).
- Visualización avanzada de datos clínicos, genómicos y de otras ‘ómicas’ mediante plataformas como cBioPortal.
- Integración de bases de datos y plataformas para asegurar una gestión eficiente y centralizada de la información.
- Desarrollo de formularios electrónicos personalizados (eCRF) en REDCap para la captura y gestión de datos de investigación.
- Implementación de procesos ETL la automatización de la trasferencia de datos entre diversas fuentes en el entorno de investigación.
- Investigación en Inteligencia Artificial para la estructuración automatizada de datos no estructurados.
- Desarrollo de aplicaciones personalizadas para el seguimiento de pacientes y muestras en ensayos clínicos, así como soluciones a medida para proyectos de investigación.
Jefa de grupo
Anna Pedrola
Ingenieras de Datos Biomédicos
Benet Fité
Carlota Gozalbo
Marina Arias
Ingeniera de Datos de Imágenes
Cristina Villaseca
Administradora de Datos
Clara Vallés
Publicaciones científicas más relevantes
- Pedrola A, Franch-Expósito S, Lahoz S, Esteban-Fabró R, Dienstmann R, Bassaganyas L, et al. PCIG: a web-based application to explore immune-genomics interactions across cancer types. Bioinformatics. 2022 Apr 15;38(8):2374–2376.
- Matos I, Villacampa G, Hierro C, Martin-Liberal J, Berché R, Pedrola A, et al. Phase I prognostic online (PIPO): A web tool to improve patient selection for oncology early phase clinical trials. Eur J Cancer. 2021 Sep;155:168–78.
- Cedres, S., Assaf, J. D., Iranzo, P., Callejo, A., Pardo, N., Navarro, A., Martinez-Marti, A., Marmolejo, D., Rezqallah, A., Carbonell, C., Frigola, J., Amat, R., Pedrola, A., Dienstmann, R., & Felip, E. (2021). Efficacy of chemotherapy for malignant pleural mesothelioma according to histology in a real-world cohort. Scientific reports, 11(1), 21357.
- Mirallas, O., Martin-Cullell, B., Navarro, V., Vega, K.S., Recuero-Borau, J., Gómez-Puerto, D., López-Valbuena, D., de Torres, C.S., Andurell, L., Pedrola, A. and Berché, R., 2024. Development of a prognostic model to predict 90-day mortality in hospitalised cancer patients (PROMISE tool): a prospective observational study. The Lancet Regional Health–Europe.
- SYNTHIA: Synthetic Data Generation Framework for Integrated Validation of Use Cases and AI Healthcare Applications. Funded by the European Commission. 01/09/2024-31/08/2029. PI: Rodrigo Dienstmann
- DART; Building Data Rich Clinical Trials. CCE_DART is an innovative EU-funded project dedicated to deliver novel methods for
the design and implementation of newer, more efficient and effective clinical trials in oncology - CancerCoreEurope: Seven Leading Cancer Centres Improve Cancer Health in Europe.
- Historia clínica Inteligente: Transformando Notas Clínicas en Datos Estructurado.
- AI4Lungs: AI-Based Personalised Care for Respiratory Disease using Multi-Modal Data in Patient Stratification
- EUCANCan: a federated network of aligned and interoperable infrastructures for the homogeneous analysis, management and sharing of genomic oncology data for Personalized Medicine.
- UpSMART Accelerator Management Team – SMART Experimental Cancer Medicine Trials eNABLED.
- American Association for Cancer Research’s (AACR) Genomics Evidence Neoplasia Information Exchange (GENIE) project.