A+ A-

Revista: Biología cuántica


¿Diseñar proteínas desde cero y con precisión atómica?

  • Enrique Marcos Benteo

  • Instituto de Biología Molecular de Barcelona (IBMB)-CSIC

INTRODUCCIÓN

Las proteínas acometen sus funciones formando estructuras tridimensionales que se corresponden con el mínimo global de energía libre, y que constituyen verdaderos entramados de interacciones atómicas muy bien balanceadas. Típicamente el esqueleto de una proteína se pliega de forma estable y definida cuando forma interacciones hidrofóbicas empaquetadas eficientemente en su interior, mientras expone los aminoácidos polares en su superficie (donde se solvatan con el agua y forman puentes salinos y/o de hidrógeno intra-moleculares), al tiempo que el esqueleto proteico no presenta tensiones que desestabilicen las estructuras secundarias. Un desbalance en estas interacciones puede, por ejemplo, aumentar la propensión de la proteína a agregarse (si hay un exceso de átomos hidrofóbicos en la superficie) o simplemente dificultar su plegamiento (si hay átomos polares en el interior que no participen en puentes de hidrógeno). Sin duda, la capacidad teórica para describir estas interacciones atómicas es clave para la predicción de la estructura a partir de la secuencia, y para la simulación de la dinámica conformacional de las proteínas asociada al reconocimiento molecular, la catálisis enzimática o la regulación alostérica. Una prueba de que hemos avanzado enormemente en la modelización de las interacciones atómicas es nuestra reciente mayor capacidad para diseñar computacionalmente proteínas desde cero (de novo), es decir, construir esqueletos proteicos con nuevas estructuras y calcular secuencias de aminoácidos que se pliegan en dichas estructuras. Tal y como dijo el gran físico teórico Richard Feynman, “Lo que no puedo crear no lo entiendo”.

 

 

El marco teórico más riguroso para describir las interacciones atómicas es la Mecánica Cuántica. No obstante, la imposibilidad práctica de aplicarla al estudio de los sistemas de miles de átomos, como son las proteínas, ha motivado el desarrollo de múltiples métodos basados en la Mecánica Molecular que aproximan los efectos cuánticos a un menor coste computacional. Esta metodología descompone la energía en distintos términos, que se calculan eficientemente con un conjunto de ecuaciones parametrizadas (también conocidas como “campo de fuerzas”), para reproducir datos experimentales o cálculos cuánticos sobre sistemas más pequeños. Estos métodos constituyen la base de los programas de dinámica molecular, como Amber o Gromacs. De forma similar, la función de energía de Rosetta, que es el programa de predicción y diseño de proteínas de uso más extendido, calcula los distintos aspectos de la energía (enlaces químicos, interacciones electrostáticas y de Van der Waals, puentes de hidrógeno, solvatación, etc.) combinando términos calculados con ecuaciones de la física clásica con otros términos calculados con potenciales estadísticos (los cuales asignan la energía en base a una distribución de probabilidades obtenida a través de estructuras experimentales). Una limitación de los campos de fuerzas es que no permiten describir reacciones químicas, al tratarse de cambios en los enlaces químicos. Sin embargo, los métodos híbridos de mecánica cuántica (QM) / mecánica molecular (MM) (QM/MM) permiten modelar la reactividad de enzimas describiendo la pequeña zona donde ocurre la reacción con QM y el resto del sistema con MM. Esta estrategia consigue la modelización multi-escala de sistemas altamente complejos y fue reconocida con el premio Nobel de Química en 2013.

 

DISEÑO DE PROTEÍNAS "DE NOVO"

Como mencionaba anteriormente, ahora disponemos del conocimiento y de las herramientas necesarias para abordar el diseño de novo de proteínas. Este es un campo revolucionario de la ingeniería de proteínas que nos permite superar las limitaciones que frecuentemente encontramos al modificar una proteína natural para que realice la función buscada. A pesar del creciente número de estructuras depositadas en el “Protein Data Bank”, en muchas ocasiones es difícil encontrar una estructura resuelta con la geometría, tamaño o forma necesarias, y que tenga la suficiente estabilidad para tolerar nuevas mutaciones para la función de interés. Con las proteínas de novo minimizamos la dependencia en estructuras naturales y adquirimos un gran control sobre la estructura. Para ello, en un primer paso, se generan computacionalmente esqueletos de proteínas, según las topologías y las restricciones geométricas prefijadas por el diseñador, que permiten adaptar o “customizar” el esqueleto al problema en cuestión. Generalmente los plegamientos se construyen por ensamblaje de fragmentos peptídicos cortos con la estructura secundaria deseada y se aparean según la topología de interés. Para la construcción de estructuras muy regulares, como los paquetes (bundles) de hélices, se utilizan las ecuaciones paramétricas de Francis Crick, que permiten un muestreo conformacional exhaustivo. En un segundo paso, se calculan las secuencias de aminoácidos que minimizan la energía de estos esqueletos, formando interacciones hidrofóbicas bien empaquetadas en el interior e interacciones polares (de puente de hidrógeno y puentes salinos) en la superficie. 

 

Los modelos generados se ordenan por su energía y otras métricas relacionadas con la eficiencia del empaquetamiento, las propiedades de la superficie, etc. Finalmente, se verifica la compatibilidad de los mejores pares secuencia-estructura con las simulaciones de plegamiento “ab initio”. Si las estructuras de mínima energía que se predicen están cerca de la estructura diseñada y las conformaciones competitivas tienen energías notablemente mayores se consideran simulaciones que validan correctamente el diseño y son aptas para su caracterización experimental. Actualmente, hay una gran diversidad de proteínas de novo diseñadas con distintos plegamientos (alfa, beta y mixtos alfa/beta; ver Figura 1), que siguen esta secuencia de pasos, y tienen altos niveles de expresión recombinante en Escherichia coli. La mayoría de ellas son hiperestables (con temperaturas de desnaturalización mayores a 95ºC), y con estructuras experimentales (por cristalografía de rayos X o resonancia magnética nuclear) en gran concordancia con los modelos computacionales. 

 

 

DISEÑO DE FUNCIONES DE UNIÓN A LIGANDO

En los últimos cinco años ha habido un gran avance en el diseño de plegamientos con capacidad para albergar sitios de unión para moléculas pequeñas y metales, algunos de ellos con configuraciones óptimas para la transferencia de energía y/o electrónica. Para formar los sitios de unión en las proteínas son necesarias estructuras de cierto tamaño que combinen múltiples elementos de estructura secundaria y puedan dar forma a un centro activo. Un ejemplo son los barriles TIM, que es el plegamiento de una gran cantidad de enzimas naturales. Los barriles TIM de novo se han diseñado con alta estabilidad y con secuencias distantes de las naturales. Recientemente se diseñaron para unir un metal lantánido trivalente (terbio) y generar luminiscencia. Aprovechando la forma de barril, se diseñó una corona de cuatro glutamatos, en la orientación necesaria para unir al metal, y dos triptófanos sensibilizadores que transfieren su energía de excitación (a 280 nm) al metal aumentando su luminiscencia. 

 

Otro ejemplo paradigmático ha sido el diseño de barriles beta para unir el cromóforo de la proteína fluorescente verde (3,5-difluoro-4-hidroxibenciliden imidazolinona, DFHBI). Este es el primer ejemplo de una proteína totalmente adaptada para unir una molécula (Figura 2). El cromóforo en disolución tiene una conformación (no planar) que no produce fluorescencia, pero cuando la proteína une el cromóforo en la conformación cis-planar es fluorescente. Para ello se diseñaron, en primer lugar, un conjunto de esqueletos de barriles beta y se seleccionaron aquellos capaces de orientar una serie de aminoácidos y formar puentes de hidrógeno e interacciones hidrofóbicas con el cromóforo. Una vez formado el centro activo, se diseñó el resto de las posiciones que estabilizan el centro activo y el propio plegamiento. Es interesante comparar este barril de diseño con la proteína fluorescente verde que típicamente se utiliza para monitorizar por fluorescencia un gran número de proteínas de estudio. El barril de diseño es la mitad en tamaño (110 vs 238 aminoácidos), lo que representa una ventaja en los estudios de monitorización ya que perturbaría en menor medida la proteína objeto de estudio. 

 

 

El diseño de las interacciones proteína-proteína también ha experimentado un avance considerable y representa una gran oportunidad para el desarrollo de fármacos con propiedades superiores a los anticuerpos monoclonales, debido a la gran estabilidad y facilidad de producción de las proteínas de novo. Aprovechando la información experimental de los complejos proteína-proteína existentes, se han diseñado inhibidores de hemaglutinina (proteína de superficie del virus de la gripe) y la toxina botulínica, proteínas miméticas de interleucina-2, para inmunoterapia del cáncer, y más recientemente, inhibidores de SARS-CoV-2. Para aplicaciones de biología sintética, se han diseñado oligómeros de hélices alfa formados por redes de puentes de hidrógeno que emulan la forma en que las dos cadenas de ADN se aparean por complementariedad de las bases. La capacidad de generar este plegamiento de forma paramétrica permite explorar conformaciones, con la suficiente precisión para identificar aquellas en las que en el interior se pueden formar redes de puentes de hidrógeno entre aminoácidos polares con geometrías estables. Los puentes de hidrógeno dan especificidad a la estructura. De esta manera, se han diseñado heterodímeros que se autoensamblan según patrones específicos de puentes de hidrógeno, y dan lugar a dímeros ortogonales que actúan como puertas lógicas.

 

DISEÑO DE ENZIMAS

El diseño de enzimas ha demostrado ser un problema más difícil que el de la unión de ligandos, al requerir una precisión mayor en el posicionamiento de los aminoácidos alrededor del sustrato y el control sobre las interacciones a larga distancia que afectan a la dinámica del centro activo. Los primeros estudios donde se diseñaron enzimas de novo consistieron en instalar conjuntos de aminoácidos en una orientación determinada que estabilizara el estado de transición de la reacción a catalizar. Se trataba de buscar posiciones compatibles con la geometría teórica del estado de transición entre cavidades de librerías de proteínas existentes. Esta estrategia fue aplicada a varios tipos de reacciones no naturales (retro-aldólica, eliminación de Kemp, Diels-Alder, Bayliss-Hillman). No obstante, las actividades catalíticas de los diseños computacionales solían ser mucho más bajas que las habitualmente observadas en las enzimas naturales, y requerían la optimización por evolución dirigida para llevarlas hasta eficiencias comparables a las naturales. 

 

 

Estos estudios pusieron de relieve el gran desafío que supone el diseño computacional de un centro catalítico. La evolución dirigida cambiaba en gran medida el entorno inicial del sustrato, en ocasiones alteraba el posicionamiento de los residuos claves de la catálisis o acababa reorientando el sustrato dentro de la cavidad. Por otro lado, para muchos plegamientos naturales se observó que no toleraban la instalación del centro activo, teniendo problemas de estabilidad o simplemente no dando actividad. 

 

Si las proteínas de novo tienden a ser más predecibles en su comportamiento es de esperar que puedan resultar efectivas para el diseño de enzimas. ¿Tenemos el suficiente control estructural para ello? Los primeros pasos se han empezado a dar. El grupo de Woolfson diseñó unos barriles formados por siete hélices alfa con una cavidad en su interior y logró implementar una actividad hidrolasa. Al tratarse de una proteína hiperestable pudieron introducir hasta veintiuna mutaciones para estabilizar el centro activo. La geometría era compatible con una triada catalítica formada por el nucleófilo (cisteína o serina), el grupo imidazol de la histidina que desprotona al nucleófilo y un aspartato o glutamato que polariza la histidina para activar la reacción. Ahora bien, queda mucho camino por recorrer para generalizar el diseño de enzimas con variedad de actividades en proteínas de novo.

 

 

PERSPECTIVAS

Como ocurre en las distintas ramas de la biología y la química computacional, el avance en el diseño computacional de proteínas hacia estructuras y funciones cada vez más complejas y con mayor precisión irá fuertemente ligado a avances en hardware que permitan realizar un número cada vez mayor de cálculos en paralelo y a mayor velocidad. En última instancia, que permitan muestrear más posibilidades y converger hacia soluciones mejores. Uno de los avances que se anticipa y será una gran revolución es la computación cuántica. Hay estudios iniciales donde se han empezado a adaptar los algoritmos de diseño de proteínas a la arquitectura de los ordenadores cuánticos como D-Wave 2000Q, ya que pueden ser especialmente beneficiosos para resolver de forma eficiente el problema de optimizar la secuencia para una estructura dada. La optimización de la secuencia para una proteína de N posiciones, donde en cada posición puede haber m rotámeros posibles (identidad de aminoácido y conformación de su cadena lateral), supone encontrar la mejor de las mN combinaciones; y teniendo en cuenta un tamaño de proteína promedio de cien aminoácidos y cientos de rotámeros posibles por posición se trata de un problema de combinatoria altamente costoso que requiere de importantes aproximaciones para ser abordado con CPUs. La ventaja de la computación cuántica es la gran paralelización que puede lograrse modelando varias soluciones simultáneamente, las cuales se doblan con cada bit cuántico (qubit). La ley de Moore predice que los qubits de los ordenadores cuánticos se doblan cada año. Esto último, añadido a las mejoras progresivas de conectividad entre qubits sugiere que teóricamente, en el plazo de unos cinco años, los cálculos de diseño de novo en los ordenadores cuánticos podrían empezar a resultar más eficientes.

 

El diseño de novo de proteínas ha experimentado un avance muy significativo en la última década. Hoy permite diseñar gran variedad de plegamientos hiperestables y compatibles con funciones asociadas a la unión a moléculas pequeñas y proteínas. Para alcanzar actividades altas todavía es necesaria, en muchas ocasiones, la optimización experimental, como por ejemplo con evolución dirigida, pero las mejoras continuas en el cálculo de las actividades y la incorporación de algoritmos de aprendizaje automático, previsiblemente, robustecerán las predicciones computacionales minimizando la evaluación experimental. Estamos en un momento excitante en la ingeniería de proteínas, que nos abre la oportunidad de crear proteínas desde cero para ofrecer soluciones novedosas a los retos actuales en biotecnología, medicina y química verde.

 

PARA LEER MÁS

Burton AJ, et al. “Installing hydrolytic activity into a completely de novo protein framework”. Nature Chemistry 8 (2016) 837-44.

Dou J, et al. “De novo design of a fluorescence-activating b-barrel”. Nature 561 (2018) 485-91.

P Huang et al. “The coming of age of de novo protein design”. Nature 537 (2016) 320-7

Leman JK, et al. “Macromolecular modeling and design in Rosetta: recent methods and frameworks”. Nature methods 17 (2020) 665-80.

Pan X, Kortemme T. “Recent advances in de novo protein design: Principles, methods and applications”. Journal of Biological Chemistry 296 (2021) 100558.

 

 


¿Te ha gustado este artículo? Compártelo en las redes sociales: