Marco de lectura abierto

En genética molecular , un marco de lectura abierto , o marco de lectura abierto ( marco de lectura abierto , o ORF en inglés), es parte de un marco de lectura que puede traducirse en proteína o péptido . Es una secuencia de codones que comprende el codón de inicio y un codón de terminación , generalmente UAA, UAG o UGA. Un codón de iniciación AUG del marco de lectura abierto, un codón que no es necesariamente el primero de este codón, puede indicar el inicio de la traducción. El sitio de terminación de la transcripción se encuentra después del marco de lectura abierto, más allá del codón de terminación. El concepto de marco de lectura abierto se utiliza ampliamente para la predicción de genes .

Los marcos de lectura abiertos que codifican proteínas en su longitud se reconocen con mayor frecuencia. El código genético que comprende 64 codones, incluidos tres codones de terminación, la longitud media de un marco de lectura abierto en una secuencia "aleatoria" es de unos veinte codones. Las cadenas de proteínas con una longitud media de 300 a 400  residuos de aminoácidos , están asociadas con marcos de lectura abiertos de codones 300 a 400, que por lo tanto son fácilmente distinguibles del ruido de fondo .

En eucariotas , los genes suelen contener múltiples exones , por lo que los marcos de lectura abiertos abarcan múltiples exones; estos se empalman para eliminar los intrones en el ARN mensajero con el fin de reconstituir la secuencia codificante ( secuencia de ADN codificante o CDS en inglés), que siempre se incluye en un marco de lectura abierto con, aguas arriba de la secuencia codificante, la región no traducida 5 (5'-UTR) y, corriente abajo de la secuencia codificante, la región no traducida 3 ' (3'-UTR). Los intrones pueden contener codones de terminación y no necesariamente tienen un tamaño divisible por 3. Por tanto, la noción de marco de lectura abierto se aplica al ARNm maduro, después del corte y empalme.

En el contexto de la predicción de genes, la definición de inicio-parada de un marco de lectura abierto a veces se cuestiona, a favor de una definición de parada-parada considerada más general, porque se puede aplicar a la búsqueda de exones en genomas eucariotas y en análisis de genes / transcripciones parciales, obtenidos, por ejemplo, mediante secuenciación de transcriptomas o metagenomas .

Descripción

Cada secuencia de ADN puede contener tres marcos de lectura desplazados por un nucleótido entre sí (+1 o -1). En el ADN , puede haber transcripción en ARN de cualquiera de las dos cadenas , lo que da como resultado un total de seis marcos de lectura.

La búsqueda de marcos de lectura abiertos se ha visto facilitada por la aparición de herramientas bioinformáticas eficientes. Esta investigación es más fácil en procariotas que en eucariotas, los genes de estos últimos están compuestos por una sucesión de intrones y exones .

enlaces externos

Referencias

  1. Claverie, J.-M. (1997) Métodos computacionales para la identificación de genes en secuencias genómicas de vertebrados. Mmm. Mol. Escoba. 6 , 1735-1744.
  2. P. Sieber, M. Platzer, S. Schuster (2018) La definición de marco de lectura abierto revisada. Trends Genet. 34 , 167-170.