Exon


Schematische Darstellung von Exons und Introns auf der Ebene der DNA, prä-mRNA und mRNA.

Als Exon (von engl. expressed region) wird der Teil eines eukaryotischen Gens bezeichnet, der nach dem Spleißen (Splicing) erhalten bleibt. Dem gegenüber stehen die Introns (von engl. intervening region), die beim Spleißen herausgeschnitten und abgebaut werden. Das typische humane Gen enthält durchschnittlich acht Exons mit einer mittleren Länge der internen Exons von 145 Nukleotiden. Introns sind im Durchschnitt mehr als 10-mal so lang, in einigen Fällen sind sie sogar noch wesentlich länger.[1]

Die Exons Protein-kodierender Gene enthalten den offenen Leserahmen (ORF) und zusätzlich den 5' und 3' untranslatierten Bereich (UTR) aus den terminalen Exons. Nur etwa 1,5 Prozent der gesamten genomischen DNA kodieren für Proteine (das haploide humane Genom beläuft sich auf rund 23.000 Protein-kodierende Gene[2]), während der Rest aus Genen für non-coding RNA, sowie Introns, regulatorischer DNA und nichtkodierenden Desoxyribonukleinsäuren (sogenannte "junk" DNA) besteht.[3] Da viele der Protein-kodierenden Gene, u. a. durch alternatives Splicing des Primärtranskripts (Präkursor-mRNA) eines Gens mehr als ein Protein produzieren, kommen im menschlichen Körper aber weit mehr als nur 23.000 verschiedene Proteine vor. Hierbei entscheidet es sich erst während des Spleißvorgangs, welche DNA-Sequenzen Introns und welche Exons sind. Mit anderen Worten: Da nicht immer nach dem gleichen festen Muster gespleißt wird (vgl. Alternatives Spleißen), ist die genaue Angabe von Exons nur bedingt möglich, da je nach fertiger mRNA unterschiedliche Teile eines Gens als Exons definiert werden können. Eine genaue Voraussage von Exons mittels der Bioinformatik ist daher äußerst schwierig (vgl. Spleißstelle und Exon Trapping).

Darüber hinaus kennt man heute Proteine, die aus Exonen von Genen aus räumlich weit entfernten Regionen, mitunter sogar unterschiedlichen Chromosomen, aufgebaut sind.[4] Mithin ist die traditionelle Ein-Gen-ein-Enzym-Hypothese (auch: Ein-Gen-eine-mRNA-ein-Protein-Hypothese) für höhere Organismen heute nicht mehr haltbar.[5][6]

Polycistronische mRNA besteht aus multiplen ORFs in einem Transkript, mit kurzen Regionen von UTRs zwischen den ORFs.

Die regelmäßige Abfolge von Exons und Introns macht die typische Struktur der eukaryotischen Gene aus – das sogenannte Mosaikgen (engl. split gene) –, für dessen Entdeckung Richard John Roberts und Phillip A. Sharp 1993 mit dem Nobelpreis für Medizin ausgezeichnet wurden.

Geschichte

Der Begriff Exon wurde 1978 von dem Biochemiker Walter Gilbert geprägt: "The notion of the cistron… must be replaced by that of a transcription unit containing regions which will be lost from the mature messenger – which I suggest we call introns (for intragenic regions) – alternating with regions which will be expressed – exons."[7] Die Definition wurde ursprünglich für proteinkodierende Transkripte eingeführt, später jedoch für rRNA,[8] tRNA[9] und trans Splicing[10] erweitert.

Einzelnachweise

  1. Lander, E. S. et al.: Initial sequencing and analysis of the human genome. In: Nature. 15. Jahrgang, Nr. 409, 2001, S. 860–921, PMID 11237011.
  2. International Human Genome Sequencing Consortium: Finishing the euchromatic sequence of the human genome. In: Nature. 431. Jahrgang, Nr. 7011, 2004, S. 931–45, doi:10.1038/nature03001, PMID 15496913. [1]
  3. International Human Genome Sequencing Consortium: Initial sequencing and analysis of the human genome. In: Nature. 409. Jahrgang, Nr. 6822, 2001, S. 860–921, doi:10.1038/35057062, PMID 11237011. [2]
  4. Kapranov, P. et al.: Examples of the complex architecture of the human transcriptome revealed by RACE and high-density tiling arrays. In: Genome Res. 15. Jahrgang, Nr. 7, 2005, S. 987–997, PMID 15998911.
  5. Rupert, J. L.: Genomics and environmental hypoxia: what (and how) we can learn from the transcriptome. In: High Alt Med Biol. 9. Jahrgang, Nr. 2, 2008, S. 115–122, PMID 18578642.
  6. Pennisi, E.: Genomics. DNA study forces rethink of what it means to be a gene. In: Science. 15. Jahrgang, Nr. 316, 2007, S. 1556–1557, PMID 17569836.
  7. Gilbert W: Why genes in pieces? In: Nature. 271. Jahrgang, Nr. 5645, 1978, S. 501, doi:10.1038/271501a0, PMID 622185.
  8. Kister KP, Eckert WA: Characterization of an authentic intermediate in the self-splicing process of ribosomal precursor RNA in macronuclei of Tetrahymena thermophila. In: Nucleic Acids Research. 15. Jahrgang, Nr. 5, März 1987, S. 1905–20, doi:10.1093/nar/15.5.1905, PMID 3645543, PMC 340607 (freier Volltext).
  9. Valenzuela P, Venegas A, Weinberg F, Bishop R, Rutter WJ: Structure of yeast phenylalanine-tRNA genes: an intervening DNA segment within the region coding for the tRNA. In: Proceedings of the National Academy of Sciences of the United States of America. 75. Jahrgang, Nr. 1, Januar 1978, S. 190–4, doi:10.1073/pnas.75.1.190, PMID 343104, PMC 411211 (freier Volltext).
  10. Liu AY, Van der Ploeg LH, Rijsewijk FA, Borst P: The transposition unit of variant surface glycoprotein gene 118 of Trypanosoma brucei. Presence of repeated elements at its border and absence of promoter-associated sequences. In: Journal of Molecular Biology. 167. Jahrgang, Nr. 1, Juni 1983, S. 57–75, doi:10.1016/S0022-2836(83)80034-5, PMID 6306255.

Weblinks