El tamaño del genoma es la cantidad de ADN contenida en una copia de un genoma . El tamaño de un genoma también se refiere como el valor C . Se mide ya sea por su masa donde usamos el picogramo , anotado pg como unidad, o por el número de nucleótidos ( pares de bases ) con la Megabase, anotado Mb (1 millón de nucleótidos) como unidad: 1 pg corresponde a 978 Mb (este la equivalencia planteada entre el número de pares de bases y la masa en picogramos se ve facilitada por el hecho de que un par GC tiene una masa molecular muy cercana a un par AT).
El término "tamaño del genoma" a menudo se atribuye erróneamente a Hinegardner, ya que Hinegardner usó este término en 1969 para significar "número de genes". Por otro lado, enFebrero de 1969, Wolf y col. usó el término "tamaño del genoma" con el significado actual. El término "tamaño del genoma" se hizo popular a principios de la década de 1970, posiblemente después de la publicación del libro de Susumu Ohno , Evolution by Gene Duplication .
o simplemente:
El tamaño de los genomas eucariotas es muy variable. El parásito intracelular Encephalitozoon cuniculi tiene un genoma de 2.8 Mb (2.8 millones de pares de bases) mientras que la ameba Polychaos dubnium podría tener un genoma de 675 Gb (mil millones de pares de bases), aunque esta vieja estimación puede ser cuestionada. Estas variaciones también pueden ser significativas dentro del mismo grupo: el tamaño del genoma en los artrópodos varía en el orden de 250 veces, en los peces 350 veces y en las angiospermas 1000 veces. La variación en los tamaños del genoma se debe a una diferencia en la tolerancia al aumento del genoma, así como a una tasa diferente de pérdida de ADN según la especie. Por ejemplo, el genoma relativamente compacto de la mosca Drosophila melanogaster se debe a una alta tasa de pérdida de ADN por deleción, mucho más alta que la de los mamíferos. Además, parecía que no había correlación entre el tamaño del genoma y la complejidad de un organismo. Esta observación ha sido llamado el valor C paradoja .
Finalmente, contrariamente a la opinión actual, la historia evolutiva de los seres vivos no debe confundirse con la historia de su complejificación (a nivel de organismos y a nivel genómico) porque parece que la reducción del genoma es el modo dominante de evolución.
Reducir el tamaño de un genoma es una regla general en virus y procariotas. La relación o regla de Drake en estos organismos muestra una relación inversamente proporcional entre el tamaño de los genomas de estos microbios y una estimación de su tasa de mutación espontánea general (en promedio, una mutación por genoma cada 200 generaciones de células, mutación que ocurre durante la replicación del ADN, o bajo el efecto de mutágenos, diversos compuestos químicos, rayos ultravioleta, radiactividad, radicales libres resultantes del metabolismo celular). Esta reducción del genoma también puede ocurrir durante errores en los mecanismos de reparación del ADN .
Esta reducción también se ha demostrado en parásitos eucariotas (por ejemplo: Encephalitozoon cuniculi ) o también en simbiontes intracelulares (por ejemplo: Buchnera aphidicola ). En el caso de los simbiontes intracelulares, la reducción del genoma se acompaña de la transferencia de genes del simbionte al núcleo de la célula huésped. Este proceso es la base de la teoría endosimbiótica del origen de las mitocondrias y los cloroplastos .
La relación de Drake solo es válida para virus y procariotas, porque en eucariotas la relación sería al revés.
Los mecanismos son:
En las plantas , la amplificación de los retrotransposones LTR parece ser una causa importante de variación en el tamaño del genoma. Así, el 70% del genoma del maíz está compuesto por retrotransposones LTR. Esta expansión del retrotransposón indujo la duplicación del genoma del maíz en unos pocos millones de años. En los artrópodos , la tasa de pérdida de ADN parece ser el factor principal de variación en el tamaño del genoma. Así, el grillo de Hawai tiene un genoma 11 veces mayor que el de la mosca Drosophila melanogaster y una tasa de pérdida de ADN 40 veces menor. En las bacterias , el tamaño del genoma se correlaciona con la tasa de genes duplicados.
Estructurales genómica datos muestran que el tamaño de un genoma no es proporcional a la complejidad del organismo: esta es la paradoja valor C . Por ejemplo, el tamaño del genoma del guisante es 1,5 veces mayor que el de los humanos, el del arroz cultivado es diez veces mayor. Esta paradoja se atribuye a la tasa relativa de expansión de secuencias repetitivas dispersas según el linaje y a la eliminación de secuencias sin importancia. Estas secuencias repetitivas representan apenas un pequeño porcentaje de ciertos genomas eucariotas como los de levadura y Drosophila, pero más del 50% del genoma humano y más del 90% del genoma de especies tan diversas como ciertas langostas, liliáceas y amebas. .
El tamaño del genoma es un " rasgo biológico " significativo porque se correlaciona con el tamaño celular y nuclear, la tasa de actividad metabólica y la duración de la mitosis y la meiosis. Sin embargo, se han propuesto varios modelos para explicar la función selectiva y el origen de la variación en el tamaño del genoma. Una de las explicaciones del origen es la importancia del ADN no codificante (llamado incorrectamente "ADN basura") que consiste en particular en secuencias repetidas que tienen un papel en la regulación de la expresión génica . El supuesto genetista Michael Lynch (en) , a veces llamado "supuesto de riesgo mutacional" (hipótesis de riesgo mutacional o MH), tuvo un gran impacto en la genómica al desarrollar su estilo y capacidad para explicar muchas características evolutivas de los genomas eucariotas. Basado en la genética de la población , propone que el tamaño efectivo de la población (en) tiene un impacto decisivo en el tamaño del genoma. De hecho, la eficacia de la selección para limitar la propagación de genes egoístas (o de cualquier secuencia de ADN que pueda interferir a largo plazo con el valor selectivo del organismo) aumenta con el tamaño efectivo de la población. Las especies con poblaciones efectivas pequeñas, como los humanos, tenderían a acumular ADN no codificante en su genoma, mientras que las especies con tamaños grandes (comunidades bacterianas) mantendrían genomas pequeños densos en secuencias funcionales y desprovistos de fuentes, mutaciones innecesarias que a menudo son perjudiciales.
Organización | Tamaño del genoma (Mpb) | Número de genes de proteínas estimados | |
---|---|---|---|
Virus | Virus de la gripe | 0.013 | |
Bacteriófago λ | 0,05 | ||
Bacteriófago T4 | 0,165 | ||
Mimivirus | 1.2 | 1.260 | |
Bacterias | Mycoplasma pneumoniae | 0,816 | 689 |
Pelagibacter ubic | 1.3 | 1,354 | |
Haemophilus | 1.8 | 1,657 | |
Staphylococcus aureus | 2.8 | 2.619 | |
Bacillus subtilis | 4.2 | 4.106 | |
Escherichia coli | 4.64 | 4.243 | |
Arqueas | Nanoarchaeum equitans | 0,49 | 536 |
Pyrococcus abyssi | 1,77 | 1.898 | |
Sulfolobus solfataricus | 3 | 2 977 | |
Eucariotas | Encephalitozoon cuniculi | 2.9 | 1,996 |
Saccharomyces cerevisiae ( levadura ) | 12 | 5.863 | |
Plasmodium falciparum | 21,8 | 5.314 | |
Caenorhabditis elegans ( nematodo ) | 100 | 22 628 | |
Drosophila melanogaster ( mosca ) | 118 | 16,548 | |
Arabidopsis thaliana (planta) | 119 | 27,379 | |
Populus trichocarpa (álamo) | 485 | 45.500 | |
Zea mays ( maíz ) | 5,000 | 54,606 | |
Mus musculus (ratón) | 3.400 | 30.000 | |
Homo sapiens (masculino) | 3.400 | 26,517 | |
Polychaos dubium (ameba) | 675.000 |
Antes de ser secuenciado, se creía que el genoma humano contenía alrededor de 100.000 genes. Esta estimación se revisó posteriormente a la baja y actualmente es de alrededor de 24.000, similar a la planta Arabidopsis thaliana (27.379 genes).
La secuencia completa del último cromosoma del genoma humano (el cromosoma 1, el más grande, contiene solo el 8% de este genoma) se obtuvo mediante Mayo de 2006.
La flor japonesa Paris japonica , del género Paris, tiene el genoma eucariota más grande descrito: tiene casi 150 mil millones de pares de bases, casi 50 veces el tamaño del genoma humano . Esto debe tenerse en cuenta excluyendo el genoma de la Amoeba Polychaos dubium (≈700 Gbp) debido a la precisión incierta del método de medición de su genoma y el nivel de poliploidía de la especie en cuestión.