En genética , la duplicación genética es la multiplicación de material genético en un cromosoma . Hay varios mecanismos que resultan de la duplicación de una gran porción cromosómica, de un gen o de una secuencia de nucleótidos . Estos cambios en el genoma representan un motor importante en la evolución de los genomas. La duplicación de un gen crea una copia adicional liberada de la presión de selección , lo que puede permitir que la copia mude nuevamente sin consecuencias dañinas para el organismo . Es uno de los mecanismos importantes de la evolución molecular .
Sin embargo, en muchos casos estas alteraciones son responsables de enfermedades genéticas debido al exceso de datos genéticos que provocan problemas durante el desarrollo. Además, la amplificación de genes puede contribuir al crecimiento de un tumor . Por ejemplo, el oncogén C-myc a menudo se amplifica en muchos tumores .
Durante su evolución, varias especies eucariotas han experimentado una duplicación completa de su genoma. Luego hablamos de paleoploidismo . Por ejemplo, en la levadura de panadería ( Saccharomyces cerevisiae ) , su genoma se duplicó hace 100 millones de años. El genoma de muchas plantas es poliploide . Podemos citar el trigo que es hexaploide (6 copias de su genoma). Recientemente, una colaboración franco-italiana permitió secuenciar el genoma de la vid , Vitis vinifera, que reveló que el ancestro de las plantas dicotiledóneas sufrió varios eventos de duplicación de su genoma tras la divergencia de plantas monocotiledóneas y dicotiledóneas ; la planta dicotiledónea ancestral debió ser hexaploide. La hipótesis planteada sería que esta duplicación del genoma está en el origen de la radiación de las plantas dicotiledóneas.
Hay dos mecanismos que permiten la duplicación completa de un genoma:
La duplicación de genomas es poco común porque la alteración de la dosis del gen en un embrión suele ser letal . Por otro lado, del 30 al 80% de las plantas son poliploides y la explosión en el número de especies en las angiospermas se correlaciona con la duplicación completa del genoma de una planta ancestral. Esto se debe a una mayor tolerancia al cambio en el número de cromosomas en las angiospermas en comparación con los animales. Se han identificado duplicaciones genómicas recientes de menos de 150 años en muchas plantas, como en salsifí, donde las especies Tragopogon mirus y Tragopogon miscellus aparecieron hace unos 80 años por alotetraploidía. Estos hallazgos nos permiten comprender las consecuencias fenotípicas y genéticas del cambio en la ploidía.
Se está acumulando mucha evidencia que muestra que durante la evolución de los vertebrados se han producido varias duplicaciones completas del genoma. Después de la explosión del Cámbrico hace unos 450 millones de años, tuvo lugar una primera duplicación del genoma de un antepasado cordado, seguida unos 10 millones de años más tarde, al comienzo del período Devónico, por una segunda duplicación completa del genoma. Al final del Devónico , se produjo una tercera duplicación del genoma en peces con aletas radiadas .
Supuesto 2RLas primeras estimaciones del número de genes en humanos han demostrado que el genoma de los vertebrados es más complejo que el de los invertebrados. Para explicar el aumento del tamaño de los genomas de los vertebrados, Susumu Ohno propuso en 1970 que el genoma de los vertebrados es el resultado de una o más duplicaciones completas del genoma. Hoy, esta hipótesis se conoce como la hipótesis 2R (2 Ronda) porque establece que hace 450 millones de años una especie de vertebrados ancestrales experimentó dos eventos de duplicación del genoma. Durante los años 90, esta hipótesis fue extremadamente controvertida porque los vestigios de duplicaciones de genes desaparecen con la evolución. Sin embargo, hoy esta hipótesis ha reunido mucha evidencia genética y filogenética. Uno de los primeros argumentos fue la falta de conexión entre la mayoría de los genes parálogos . De hecho, después de una duplicación segmentaria, los genes duplicados están presentes en el mismo cromosoma y, por lo tanto, están ligados genéticamente. Por otro lado, tras una duplicación del genoma, los genes duplicados se encuentran en diferentes cromosomas. Finalmente, el principal argumento a favor de la hipótesis 2R provino del estudio de los complejos de genes Hox que siguen la regla 4: 1, es decir, hay un complejo Hox en invertebrados y cuatro complejos Hox en la mayoría de los vertebrados que serían el resultado de dos genomas. eventos de duplicación.
Paralogon HoxUn complejo Hox es una colección de genes homeóticos agrupados en un cromosoma que codifica factores de transcripción esenciales para el establecimiento del eje anteroposterior y la identidad segmentaria en los animales. Los cuatro complejos Hox en humanos se encuentran en los cromosomas 2, 7, 12 y 17. Cerca de cada complejo hay un gen paralog perteneciente a la familia Dlx , Collagen y / o ErbB . Por tanto, el paralogon Hox corresponde a los complejos Hox asociados con los genes paralog ubicados cerca del complejo Hox. La presencia de varios genes parálogos cerca de los complejos Hox es un argumento importante para la hipótesis 2R. Sin embargo, los análisis filogenéticos han demostrado que algunos genes parálogos y genes Hox tienen una historia evolutiva diferente que contradice la hipótesis 2R. Recientemente, un estudio propone que dos translocaciones recíprocas dentro de los complejos Hox que ocurren después de la segunda duplicación completa del genoma explicarían las diferencias en la evolución dentro del paralogon Hox.
Supuesto 3REn 1998, se identificaron siete complejos Hox en el pez cebra Danio rerio . Los autores de este estudio propusieron que después de las dos duplicaciones del genoma que ocurrieron en un vertebrado ancestral, ocurrió un tercer evento de duplicación del genoma específicamente en peces teleósteos que resultó en ocho complejos Hox seguidos de la pérdida de un complejo Hox.
Supuesto 4REn 2005, un equipo canadiense demostró que en el salmón del Atlántico y la trucha arco iris, que pertenecen a la familia de los salmónidos , había catorce complejos Hox que sugerían una nueva duplicación del genoma específico de la familia de los salmónidos .
La duplicación a veces se describe como una trisomía parcial. Hay 2 tipos de duplicación:
También podemos distinguir duplicaciones:
Muchos síndromes son el resultado de la duplicación de un segmento de un cromosoma, como el síndrome de Beckwith-Wiedemann o la enfermedad de Charcot-Marie-Tooth tipo 1 . Aunque a menudo es perjudicial para un organismo, el análisis de los genomas de muchas especies, y en particular el genoma humano, ha revelado la presencia de numerosas regiones duplicadas.
La secuenciación y el análisis del genoma humano revelaron que grandes trozos de cromosomas eran similares. 400 segmentos cromosómicos durante la evolución de los primates han sufrido numerosos eventos de duplicación intracromosómica (entre cromosomas idénticos) e intercromosómica (entre diferentes cromosomas), algunos de los cuales, que representan el 5% del genoma, son específicos del genoma humano. Estos segmentos de cromosomas duplicados se encuentran preferentemente cerca de los telómeros y centrómeros. Además, estas regiones duplicadas son sensibles a los reordenamientos cromosómicos y son el lugar de rupturas en translocaciones, deleciones o inversiones. Sin embargo, aunque deletéreos, los fragmentos de cromosomas duplicados son proporcionalmente más activos transcripcionalmente que regiones individuales de genomas de primates. Además, estas repetidas duplicaciones han creado nuevas familias de genes exclusivas de los hominoides.
Cromosoma 15El 8,8% del cromosoma 15 corresponde a segmentos cromosómicos duplicados, el 50% de los cuales son duplicaciones intracromosómicas. Por ejemplo, en la región 15q, se ha identificado una secuencia "núcleo" de 2920 pares de bases. Se repite 37 veces en el cromosoma 15, dos veces en el cromosoma Y y una vez en los cromosomas 2 y 10. El análisis de las diferentes secuencias de esta porción del cromosoma "corazón" ha permitido recapitular la historia de esta secuencia. Desde el genoma de perros y ratones contienen sólo una copia de esta secuencia de "corazón" en el cromosoma correspondiente al cromosoma 2 humano. Por lo tanto, esta secuencia se copió por retrotransposición en el cromosoma 10, luego se copió un fragmento más grande de 15 kilobases en el cromosoma 15. Este segmento de ADN de 15 Kb se duplicó varias veces en el cromosoma 15. Las dos copias de la secuencia inicial del "corazón" en el cromosoma Y es el resultado de copiar una secuencia de 40 kb del cromosoma 15. Como se mencionó anteriormente, las regiones duplicadas son porciones frágiles del cromosoma y sensibles a los reordenamientos cromosómicos. Las deleciones cromosómicas en la región duplicada 15q11-q13 son la causa de los síndromes de Prader-Willi y Angelman .
Síndrome de Beckwith-WiedemannEl síndrome de Beckwith-Wiedemann se caracteriza por un gran tamaño, macroglosia y organomegalia , y resulta en un gran número de casos de duplicación paterna de la región terminal del cromosoma 11 . Esta región cromosómica contiene dos genes esenciales para la regulación del crecimiento; los genes IGF2 y H19 . IGF2 es un factor de crecimiento que estimula la proliferación celular y H19 codifica ARN no codificante. La expresión de estos genes está altamente regulada por un mecanismo complejo de impronta parental . En el cromosoma materno, el gen "IGF2" está reprimido y H19 se expresa mientras que en el cromosoma paterno, el gen IGF2 se expresa y H19 se reprime. El síndrome es el resultado de una duplicación parcial de la parte terminal del cromosoma 11 paterno. Esta duplicación proporciona una copia adicional del gen IGF2 en el cromosoma 11 que conduce a un aumento en la producción del factor de crecimiento IGF2.
Un gen particular se puede duplicar durante la evolución. Hay cuatro mecanismos principales que permiten la duplicación de un gen o de algunos genes:
Las duplicaciones de genes son eventos extremadamente comunes. Así, el número de repeticiones de un mismo gen puede variar entre individuos de la misma especie, formando así un polimorfismo del número de repeticiones . Sin embargo, el aumento del número de genes se ve compensado por una pérdida de genes que también es bastante fuerte, principalmente por deriva genética, pero también por contra-selección del aumento de la concentración de proteínas generada por el aumento del número de genes codificantes. esta proteína.
Hay cinco escenarios evolutivos después de la duplicación de genes:
Durante la evolución de los genomas, los genes pueden fusionarse o romperse. Una de las consecuencias de la subfuncionalización de un gen duplicado puede ser la fisión de un gen en dos genes diferentes. De hecho, en el caso en el que el gen original codifica una proteína con dos dominios funcionales distintos denominados I y II, uno de los genes duplicados acumula mutaciones (degeneración) en la región correspondiente al dominio II mientras que el segundo gen acumula mutaciones en la región correspondiente a dominio I. Esto da como resultado un gen 1 que codifica una proteína con dominio I y un segundo gen que codifica una proteína con dominio II. Este mecanismo de fisión genética se ha demostrado en Drosophila durante el estudio del gen Monkey-king.
El aislamiento reproductivo es un proceso esencial para la especiación porque permite el inicio de la divergencia y el mantenimiento de distintas especies. Si dos especies estrechamente relacionadas se adaptan a entornos diferentes, sus híbridos estarán menos adaptados a estos entornos: hablamos de debilidad híbrida . Este fenómeno puede ser explicado por el modelo de incompatibilidad genética de Dobzhansky-Muller desarrollado por Theodosius Dobzhansky en 1936 y Herman Joseph Müller en 1942. El redescubrimiento de la obra de William Bateson ha llevado a algunos autores a hablar del modelo de Bateson-Dobzhansky-Muller. El modelo propone que las interacciones epistáticas negativas entre dos loci conducen a una debilidad híbrida. En 2000, Michael Lynch y Allan G. Force adaptaron el modelo de incompatibilidad genética para la duplicación de genes. Propusieron que después de la duplicación de genes, la pérdida recíproca de genes es un factor que conduce al aislamiento reproductivo. Así, este modelo explicaría la correlación entre eventos de duplicación completa del genoma y la radiación evolutiva de ciertos phyla. Por ejemplo, se ha demostrado que en el antepasado de la levadura de panadería, que experimentó una duplicación completa del genoma, la rápida pérdida de genes duplicados favoreció la aparición de muchas especies de levadura a través de un mecanismo de incompatibilidad genética.
Los microARN son ARN monocatenarios de 21-23 nucleótidos de longitud que regulan la expresión génica postranscripcional. En la planta Arabidopsis thaliana , existe una clase de microARN que exhiben una fuerte homología de secuencia con sus genes diana y que aparecieron recientemente durante la evolución. Estos microARN son el resultado de duplicaciones de genes inversas.
La duplicación en tándem de exones corresponde a la duplicación interna de un exón dentro del mismo gen. Este tipo de duplicación es una fuente importante de innovación porque permite generar nuevas fs dentro de la misma proteína. Un análisis exhaustivo de los genomas de Homo sapiens , Drosophila melanogaster y el gusano Caenorhabditis elegans mostró 12291 casos de duplicación de exones en tándem. El análisis de las regiones intrónicas también reveló 4660 exones duplicados no caracterizados. Entre estos posibles exones, el 35,1% se encuentran en las bases de datos EST confirmando su papel potencial.
La replicación de estos pares de bases está en el origen de muchas enfermedades genéticas como el síndrome de X frágil o la corea de Huntington . En la bacteria Streptococcus pneumoniae , la duplicación de 18 pares de bases en el gen rplV que codifica la proteína ribosómica L22 es responsable de la resistencia al macrólido . Esta duplicación genera una duplicación de 6 aminoácidos cerca del sitio de interacción del macrólido en la subunidad 23S del ribosoma, bloqueando así la interacción del antibiótico con el ribosoma.
El análisis de los genomas procarióticos reveló numerosos genes parálogos . Dependiendo de la especie bacteriana, la proporción de genes parálogos varía del 7% del genoma en Rickettsia conorii al 41% en Streptomyces coelicolor . De los 106 genomas bacterianos secuenciados en 2004, en promedio el 25% del genoma bacteriano consiste en genes parálogos. También existe una correlación muy fuerte entre el tamaño del genoma bacteriano y la proporción de genes duplicados.
Hay tres mecanismos de duplicación de genes en procariotas:
En Escherichia coli K12, el 16% de los genes homólogos son xenólogos, lo que sugiere que la transferencia horizontal de genes tiene un bajo impacto en la proporción de genes parálogos. En promedio, el 15% de los genes parálogos están organizados en tándem, lo que sugiere eventos de duplicación de genes en tándem que pueden resultar en la duplicación del operón .
En procariotas, no se ha demostrado una duplicación ancestral completa del genoma. Sin embargo, algunas bacterias son poliploides durante una etapa de desarrollo como Buchnera aphidicola, cuyo número de copias del genoma varía según la etapa de desarrollo de su hospedador, el pulgón verde de la madera .
La mayoría de los genomas eucariotas llevan una gran cantidad de genes duplicados funcionales, la gran mayoría de los cuales habría aparecido hace 10 a 100 millones de años. Después de eventos de duplicación masiva, se retiene alrededor del 20 al 50% de los genes duplicados. Esta conservación sugiere la existencia de un mecanismo de selección natural que compensaría la producción de pseudogenes . Después de una duplicación, puede haber una separación de funciones ancestrales entre las dos copias, por ejemplo en diferentes tejidos (fenómeno conocido como subfuncionalización ); la aparición de una nueva función para una de las copias (fenómeno conocido como neofuncionalización ); cada copia puede experimentar una pérdida o reducción en la expresión de sus funciones por mutaciones degenerativas.
La evolución del genoma bacteriano está profundamente influenciada por los intercambios de genes entre diferentes especies bacterianas. De hecho, la evolución de las vías metabólicas en E. coli resulta principalmente del intercambio de genes horizontal; sin embargo, la duplicación de genes también parece contribuir a la evolución bacteriana. Los genes preferentemente duplicados están implicados en el metabolismo de los aminoácidos , los iones inorgánicos y la regulación transcripcional . En algunas especies, la expansión genética de una clase de genes se ha propuesto como una adaptación evolutiva. Por ejemplo, la complejidad de la pared bacteriana en las micobacterias puede explicarse por una duplicación específica de este género bacteriano de genes implicados en el metabolismo y transporte de lípidos .
Las bacterias pueden adaptarse a la toxicidad de un antibiótico gracias a una gran batería de mecanismos que resultan de mutaciones puntuales o de la transferencia horizontal de genes . Los principales mecanismos de resistencia son:
La adaptación de una bacteria a un antibiótico se realiza en dos etapas:
Las amplificaciones de genes son inestables y pueden perderse en ausencia de presión de selección por recombinación homóloga. Por tanto, los genes duplicados pueden mantenerse en cepas bacterianas en las que la proteína Rec A es deficiente. Sin embargo, existen mecanismos de pérdida de genes duplicados independientes de Rec A que no se comprenden bien.
Amplificación de genes en un plásmidoA principios de la década de 1970, el descubrimiento de plásmidos R portadores de genes de resistencia a los antibióticos permitió demostrar por primera vez el papel de la duplicación de genes en el fenómeno de la resistencia a los antibióticos. El plásmido NR1 aumenta de tamaño en Proteus mirabilis en presencia de baja concentración de cloranfenicol , estreptomicina y sulfonamida . La región amplificada del plásmido se denomina determinante-r (r para la resistencia) y está flanqueado por repetición IS1 directa ( inserción de secuencia 1 ) secuencias que permiten la amplificación de la región gracias a las homologías de secuencia entre las secuencias de IS1 resultantes en la recombinación homóloga. Entre hermana cromátidas . En muchas bacterias, la resistencia asociada con la amplificación de genes en un plásmido a menudo se asocia con la presencia de la secuencia IS. Sin embargo, hay algunos casos en los que regiones homólogas imperfectas pueden permitir la amplificación de genes de resistencia, como la amplificación del gen tetL en el plásmido pAMα1, que confiere resistencia a tetraciclina en Enterococcus faecalis .
Amplificación de genes en el cromosoma bacteriano.La amplificación de genes cromosómicos es similar a la observada en plásmidos bacterianos. Por ejemplo, se ha observado una amplificación de β-lactamasa en Escherichia coli y Yersinia enterocolitica que confiere resistencia a β-lactámicos por mecanismos dependientes e independientes de la proteína Rec A. Sin embargo, hay ejemplos específicos en los que solo se duplican unos pocos pares de bases. En Staphylococcus aureus y Yersinia enterocolitica , la duplicación del sitio de entrada al ribosoma del gen de resistencia a macrólidos llamado ermA (para metilasa A de resistencia a eritromicina) conduce a la estimulación de la traducción de ermA. Finalmente, en la bacteria Streptococcus pneumoniae , la duplicación de 18 pares de bases en el gen rplV que codifica la proteína ribosómica L22 es responsable de la resistencia a macrólidos . Esta duplicación genera una duplicación de 6 aminoácidos cerca del sitio de interacción del macrólido en la subunidad 23S del ribosoma, bloqueando así la interacción del antibiótico con el ribosoma. La mayoría de las amplificaciones de genes que confieren resistencia a los antibióticos se han inducido en laboratorios de investigación. En los ensayos clínicos, la identificación de la amplificación de genes es bastante rara, probablemente debido a la inestabilidad de las amplificaciones de genes. Al cribar cepas de Streptococcus agalactiae , se aislaron dos cepas resistentes a sulfonamidas y trimetoprim con una amplificación que contenía el operón folCEPBK involucrado en la síntesis de vitamina B9 .