A+ A-

Revista: Infraestructuras Europeas en Biomedicina


ELIXIR. Infraestructura paneuropea para el uso y reuso de datos biomédicos en investigación

  • Alfonso Valencia

  • Barcelona Supercomputing Center (BSC-CNS). Instituto Nacional de Bioinformática (INB/ELIXIR-ES). Institució Catalana de Recerca i Estudis Avançats (ICREA).

  • Eva Alloza

  • Barcelona Supercomputing Center (BSC-CNS). Instituto Nacional de Bioinformática (INB/ELIXIR-ES).

  • Salvador Capella-Gutierrez

  • Barcelona Supercomputing Center (BSC-CNS). Instituto Nacional de Bioinformática (INB/ELIXIR-ES).

La popularización de las técnicas de secuenciación masiva, junto con otras técnicas experimentales desde la proteómica a la microscopía electrónica, generan cantidades masivas de datos heterogéneos, complejos, ruidosos, distribuidos e íntimamente ligados entre ellos. Una situación, que junto al abaratamiento de los costes para el almacenamiento y procesamiento de datos, han producido un cambio paradigmático en biología, aproximando y modificando la relación entre teoría, experimentos y simulaciones.

 

 

Grandes proyectos como ENCODE, GTEx, TARA/ Magallanes o el Human Cell Atlas, por nombrar unos pocos, ponen de manifiesto tanto la enorme capacidad de generación de datos y la utilidad de los mismos, así como la necesidad de contar con las infraestructuras necesarias para absorber y aprovechar las oportunidades que estos datos representan. Unas infraestructuras científicas, técnicas y humanas necesarias para almacenar, gestionar, procesar e interpretar estos datos, haciéndolos accesibles y utilizables por la amplia comunidad de científicos en las áreas de biología y biomedicina.

 

 

ELIXIR es una organización paneuropea cuya misión es coordinar los recursos de bases de datos y plataformas de análisis, junto a un importante componente de creación de capacitación en los nodos nacionales y formación, contribuyendo a formar una única infraestructura federada que facilite a los investigadores encontrar y compartir datos, desarrollar software e intercambiar experiencias y buenas prácticas en el marco conforme a la regulación europea vigente. En la actualidad, ELIXIR cuenta con 22 nodos nacionales que junto al EMBL-EBI forman la columna vertebral de esta infraestructura federada. La organización interna de cada nodo nacional es decisión de cada estado miembro que forma parte de ELIXIR y tiene como misión fundamental coordinar las actividades locales en conexión con ELIXIR. En la actualidad, los nodos nacionales contribuyen con más de 300 servicios que cubren distintos dominios científicos dentro de las ciencias de la vida, desde bioquímica, redes de interacciones, evolución y filogenia, genómica, proteómica, metagenómica, biología estructural, entre otras.

 

 

Entre estos servicios existe una serie de repositorios de datos reconocidos como ELIXIR Core Data Resources, que representan las piezas centrales de este ecosistema después de pasar por un estricto proceso de evaluación. Entre estos recursos, cabe destacar el Archivo Europeo de Genomas y Fenomas (European Genome-phenome Archive; EGA) desarrollado conjuntamente por EMBL-EBI y el Centro de Regulación Genómica (CRG) con apoyo tecnológico del Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS). Además, ELIXIR junto con sus nodos nacionales ofrece capacidades computacionales a través de la comunidad europea de Galaxy y su red de computación distribuida Pulsar.

 

Aparte de la interconexión de los nodos nacionales y las organizaciones asociadas a los mismos, ELIXIR está organizado alrededor de plataformas, comunidades de usuarios y grupos de interés de la siguiente forma:

 

  • 5 plataformas tecnológicas con la misión de facilitar el desarrollo y adopción de estándares y buenas prácticas en el desarrollo de software (Tools), mecanismos de interoperabilidad (Interoperability) entre distintas bases de datos y repositorios de datos (Data) en ELIXIR y más allá de su área de influencia para facilitar la posibilidad de analizar estos datos en infraestructuras computacionales distribuidas (Compute). Todas estas acciones cuentan con la plataforma de formación (Training) para impulsar actividades de formación en todas estas áreas en colaboración con las distintas organizaciones que forman parte de ELIXIR y facilitar la creación de capacidades técnicas a nivel local. https://elixireurope.org/platforms.
  • 13 comunidades científicas que sirven para facilitar las interacciones de los expertos científico-técnicos en ELIXIR alrededor de distintas áreas de interés y que sirven para impulsar el trabajo de las plataformas tecnológicas. Podemos destactar 3D-Bioinfo, Galaxy, Toxicología y las denominadas Human Data Communities que agrupan a comunidades como Acceso Federado a Datos Sensibles y Enfermedades Raras. https://elixir-europe.org/communities.
  • 11 grupos de interés para identificar temáticas de interés transversal en ELIXIR, y que sirven para tener un mínimo de coordinación en dichas áreas temáticas. Podemos destacar los relacionados con Biodiversidad, Datos de Investigación en Cáncer, Datos relativos a Salud, para su uso en investigación, Impacto, Innovación e Industria, Aprendizaje Automático (ML), y Biología de Sistemas. https://elixir-europe.org/focus-groups.

Estas estructuras están complementadas por representantes de los nodos nacionales en áreas técnicas y de formación así como por la oficina de interacciones con la industria.

 

El Instituto Nacional de Bioinformática (INB), creado en el 2003, es el nodo español de ELIXIR (ELIXIR-ES) y está formado en la actualidad por 17 grupos distribuidos a nivel nacional en 11 instituciones: BSC-CNS, CRG, CNAG-CRG, CNB-CSIC, CNIO, FPS, IMIM, IRB Barcelona, UMA, UPF, USAL-CSIC, con el BSC-CNS como nodo coordinador de las actividades científicotécnicas del INB/ELIXIR-ES y representante español en los distintos órganos de gobierno de ELIXIR. En la actualidad, las actividades del INB/ELIXIR-ES se desarrollan en el marco del programa de Ciencia de Datos de la Infraestructura de Medicina de Precisión asociada a la Ciencia y Tecnología (IMPaCT-Data) del Instituto de Salud Carlos III (ISCIII).

 

INB/ELIXIR-ES ofrece un portafolio de recursos bioinformáticos como parte del compromiso adquirido por España al unirse formalmente a ELIXIR en 2017. Este portafolio (https://bio.tools/t?q=’ELIXIR-ES’), conocido como Service Delivery Plan, se revisa periódicamente por un comité asesor externo para asegurar que la oferta del INB/ELIXIR-ES a la comunidad se ajusta a las necesidades existentes y está formada por servicios consolidados que siguen disponibles. A lo largo del 2022 se publicará una versión actualizada del Service Delivery Plan, dado que en la actualidad está en marcha un proceso para la revisión y actualización del mismo.

 

La naturaleza de ELIXIR es en cierto modo distinta de la de otras infraestructuras de investigación, puesto que no ofrece servicios individuales como puede ser acceso a muestras biológicas, análisis computacionales o instrumentos específicos. En el caso de ELIXIR todos los recursos de software y bases de datos son accesibles y utilizables de forma abierta, lo que supone que los nodos de ELIXIR contribuyen solidariamente tanto con los recursos disponibles en cada país, como al esfuerzo común para hacer estos recursos interoperables y fácilmente accesibles. Por ejemplo, ELIXIR contribuye sustancialmente al desarrollo de protocolos y estándares en el contexto de la Global Alliance for Genomics and Health (GA4GH), y desarrolla y aporta métodos al sistema de gestión de datos y análisis Galaxy (https://usegalaxy.eu), el cual ofrece un entorno gráfico amigable para analizar datos propios y datos disponibles en abierto.

 

 

Finalmente, ELIXIR realiza una labor de gran importancia en la construcción y armonización del espacio Europeo de datos, un ámbito en el que ofrece numerosas posibilidades de participación a los nodos nacionales. En la actualidad, el proyecto B1MG es un ejemplo sumamente importante. Este proyecto trabaja en la organización de la información genómica humana para investigación, en el que España tiene un papel destacado, y del que emanará una implementación de métodos y recomendaciones en cada país participante, contribuyendo decisivamente a facilitar el acceso y operatividad de datos compartidos a nivel Europeo en conjunción con otros espacios emergentes; por ejemplo, el Espacio Europeo de Datos en Salud. 

 

PARA LEER MÁS

Harrow J, Hancock J, ELIXIR-EXCELERATE Community, N. Blomberg “ELIXIR-EXCELERATE: establishing Europe’s data infrastructure for the life science research of the future”. The EMBO Journal (2021)40:e107409

Publicaciones relacionadas con ELIXIR, incluido el programa científico 2019-2023: https://elixir-europe.org/ about-us/publications.

 


¿Te ha gustado este artículo? Compártelo en las redes sociales: