Modelado de proteínas por enhebrado

El modelado de una proteína mediante enhebrado o modelado de reconocimiento de aliasing es una técnica utilizada para modelar proteínas que se desea que tengan el mismo codo que las estructuras proteicas conocidas pero que no tienen proteínas homólogas identificadas en la base de datos de proteínas (PDB). Por tanto, se opone al método de predicción de estructuras basado en modelos de homología . El modelado de subprocesos funciona utilizando el conocimiento estadístico de la relación entre las estructuras depositadas en el AP y la secuencia de la proteína que se desea modelar.

La predicción se realiza encadenando (es decir, colocando, alineando) cada aminoácido de la secuencia objetivo en una posición en la estructura del modelo y evaluando qué tan bien se ajusta el objetivo al modelo. Una vez que se selecciona el modelo más adecuado, se construye el modelo estructural de la secuencia en base a la alineación con el modelo elegido.

Una proteína es una estructura muy fina transversalmente pero muy larga. Esta estructura suele doblarse sobre sí misma para ocupar un espacio mínimo. La envoltura definida por esta estructura no es regular, las interacciones de los diversos campos significan que ciertas porciones de las moléculas estarán ocultas mientras que otras permanecerán disponibles para interactuar con otras moléculas. Esta forma le confiere propiedades biológicas adicionales. Por lo tanto, modelar una proteína consiste en gran medida en tratar de encontrar esta forma 3D. Un elemento definitorio de la forma son sus codos , es decir, los lugares donde la molécula se dobla en otra dirección.

Caso de uso

Si queremos inventar una nueva proteína, probablemente primero la definamos a partir de sus aminoácidos , sin embargo esto no es suficiente, su actividad biológica está definida en gran medida por su forma que es tan importante como su composición bioquímica. Pero, ¿cómo se sabe su forma si se trata de una proteína que no existe en la naturaleza? Podemos pensar que esta proteína tendrá una forma similar a la de una proteína cuya composición de aminoácidos sería cercana; a esto se le llama modelado estructural por homología . Sin embargo hay casos donde las variaciones de direcciones son rápidas y donde el método de modelado por homología da malos resultados: Codos. Por lo tanto, es necesario identificar estas curvas en proteínas existentes para poder predecirlas en proteínas recién inventadas. Este método también se puede utilizar para predecir una forma de la estructura solo a partir de la predicción de los codos. Luego, ensamblaremos cada segmento resultante de la predicción a sus vecinos. Por lo tanto, se colocan en una fila entre sí.

Modo operatorio

El enhebrado o inserción de proteínas, también conocido como reconocimiento del codo plegable , es un proceso de modelado utilizado para modelar por analogía, proteínas que tienen los mismos pliegues que las proteínas de estructuras conocidas, pero que no tienen proteínas homólogas de estructura conocida. Se diferencia del método de modelado de estructura de homología porque se usa para proteínas que no tienen la estructura de sus proteínas homólogas depositadas en la base de datos de proteínas ( PDB ), mientras que el modelado de homología se usa precisamente para proteínas que tienen proteínas homólogas depositadas en PDB, y cuya estructura se conoce.

La predicción se hace "alineando o enhebrando" cada aminoácido en la secuencia diana en una posición en una estructura de plantilla y evaluando cuán similar se vuelve la plantilla así "decorada" a la secuencia diana. Esta operación se repite en diferentes plantillas y finalmente se elige la plantilla que permite generar una estructura lo más cercana posible a la de la secuencia objetivo. El enhebrado de proteínas se basa en dos observaciones fundamentales: el número de codos plegables diferentes en la naturaleza es bastante bajo (alrededor de 1300), y el 90% de las nuevas estructuras sometidas a PDB en los últimos tres años exhiben codos plegables. PDB.

Clasificación estructural de proteínas

La base de datos de clasificación estructural de proteínas (SCOP) proporciona una descripción detallada y completa de las relaciones estructurales y evolutivas de la estructura conocida. Las proteínas se clasifican para reflejar tanto la estructura como la evolución. Existen muchos niveles en la jerarquía, pero los niveles principales son familia, superfamilia y pliegue, como se describe a continuación.

Familia (relación evolutiva obvia)

Las proteínas agrupadas en familias están claramente vinculadas por la evolución. En general, esto significa que las similitudes de residuos por pares entre proteínas son del 30% o más. Sin embargo, en algunos casos, funciones y estructuras similares proporcionan evidencia definitiva de ascendencia común en ausencia de una alta identidad de secuencia. Por ejemplo, muchas globinas forman una familia, aunque algunos miembros tienen identidades de secuencia de solo el 15%.

Superfamilia (probable origen evolutivo común)

Las proteínas que tienen una baja identidad de secuencia, pero cuyas características estructurales y funcionales sugieren que es probable que exista un origen evolutivo común, se colocan juntas en superfamilias. Por ejemplo, la actina, el dominio ATPasa de la proteína de choque térmico, y la hexakinasa forman una superfamilia.

Pliegue (gran parecido estructural)

Las proteínas se definen como que tienen un pliegue común (doblez) si tienen las mismas estructuras secundarias principales en la misma disposición y con las mismas conexiones topológicas. Diferentes proteínas con el mismo pliegue a menudo tienen elementos estructurales secundarios periféricos y regiones del codo que difieren en tamaño y conformación. En algunos casos, estas diferentes regiones periféricas pueden cubrir la mitad de la estructura. Las proteínas ubicadas en la misma categoría de codos plegables pueden no tener un origen evolutivo común: las similitudes estructurales pueden surgir solo de la física y química de las proteínas que favorecen ciertos arreglos de empaquetamiento y topología de cadena.

Método

Un paradigma general de enhebrado de proteínas consta de los siguientes cuatro pasos:

Comparación con el modelado de homología

El modelado de homología y el enhebrado de proteínas son métodos basados ​​en modelos y no existe un límite estricto entre ellos en términos de técnicas de predicción. Pero las estructuras proteicas de sus objetivos son diferentes. El modelado de homología solo será posible para dianas que tengan proteínas homólogas de estructura conocida, mientras que el enhebrado de proteínas solo es posible para dianas con solo homología de codos plegables encontrados. En otras palabras, el modelado de homología está destinado a dianas "más fáciles" y el enhebrado de proteínas está destinado a dianas "más difíciles".

El modelado de homología trata el modelo alineado como una secuencia, y solo se usa la homología de secuencia para la predicción. El subproceso de proteínas procesa la plantilla en una alineación como una estructura, y la secuencia y la información estructural extraída de la alineación se utiliza para la predicción. Cuando no se encuentra una homología significativa, el enhebrado de proteínas puede hacer una predicción basada en la información estructural. Esto también explica por qué el enhebrado de proteínas puede ser más eficiente que el modelado de homología en muchos casos.

En la práctica, cuando la identidad de secuencia en un alineamiento de secuencia de secuencia es baja (es decir, <25%), el modelado de homología puede no producir una predicción significativa. En este caso, si hay una homología distante para el objetivo, el modelado del hilo de proteínas puede generar una buena predicción.

Software de enhebrado de proteínas

Notas y referencias

  1. (en) Jian Peng y Jinbo Xu , "  Raptorx: Explotación de información para alineación de estructuras de proteínas por inferencia estadística  " , Proteínas: estructura, función y bioinformática , vol.  79, n o  S10,2011, p.  161-171 ( DOI  10.1002 / prot.23175 , leído en línea , consultado el 9 de junio de 2019 )
  2. (en) J. Peng y J. Xu , "  Low-proteína homología roscado  " , Bioinformática , vol.  26, n o  12,15 de junio de 2010, i294 - i300 ( ISSN  1367-4803 y 1460-2059 , PMID  20529920 , PMCID  PMC2881377 , DOI  10.1093 / bioinformatics / btq192 , leído en línea , consultado el 9 de junio de 2019 )
  3. (en) Jian Peng y Jinbo Xu , "  enfoque de múltiples plantillas para el enhebrado de proteínas A  " , Proteínas: estructura, función y bioinformática , vol.  79, n o  6,junio 2011, p.  1930-1939 ( DOI  10.1002 / prot.23016 , leído en línea , consultado el 9 de junio de 2019 )
  4. (en) Jianzhu Ma Jian Peng Sheng Wang y Jinbo Xu , "  Campos neuronales condicionales para el modelo de subprocesamiento de proteínas  " , Bioinformática , vol.  28, n o  12,15 de junio de 2012, i59 - i66 ( ISSN  1460-2059 y 1367-4803 , PMID  22689779 , PMCID  PMC3371845 , DOI  10.1093 / bioinformatics / bts213 , leído en línea , consultado el 9 de junio de 2019 )
  5. (en) Sitao Wu y Yang Zhang , "  Muster: Mejorar las alineaciones de secuencias de proteínas perfil-perfil mediante el uso de múltiples fuentes de estructura de información  " , Proteínas: estructura, función y bioinformática , vol.  72, n o  24 de febrero de 2008, p.  547–556 ( DOI  10.1002 / prot.21945 , leído en línea , consultado el 9 de junio de 2019 )
  6. (en) Y. Yang , E. Faraggi , H. Zhao y Y. Zhou , "  Mejora del reconocimiento de pliegues de proteínas y modelado basado en plantillas mediante el empleo de coincidencias basadas en probabilísticas entre Propiedades estructurales unidimensionales predichas de consultas nativas y propiedades correspondientes de plantillas  ” , Bioinformática , vol.  27, n o  15,1 st de agosto de 2011, p.  2076–2082 ( ISSN  1367-4803 y 1460-2059 , PMID  21666270 , PMCID  PMC3137224 , DOI  10.1093 / bioinformatics / btr350 , leído en línea , consultado el 9 de junio de 2019 )
  7. (en) D. Gront , Sr. Blaszczyk , P. Wojciechowski y A. Kolinski , "  BioShell Threader: la detección de homología de proteínas se basa en la secuencia de perfiles y perfiles de estructura secundaria  " , Nucleic Acids Research , vol.  40, n o  W1,1 er de julio de 2012, W257 - W262 ( ISSN  0305-1048 y 1362-4962 , PMID  22693216 , PMCID  PMC3394251 , DOI  10.1093 / nar / gks555 , leído en línea , consultado el 9 de junio de 2019 )

Bibliografía

enlaces externos