Sehenswürdigkeiten auf der Genom-Karte platzieren
Behind the Scenes Artikel wurde LiveScience in Zusammenarbeit mit der National Science Foundation zur Verfügung gestellt.
Supercomputer und nächsten Generation gen Sequenzer erlauben Forschern, DNA und Vererbung zu erforschen.
Wir denken in der Regel der Vererbung – Augenfarbe, Körperbau oder Anfälligkeit für eine Krankheit – in unseren Genen verankert. Und es ist. Aber wie Biologen mehr Genom sequenzieren und analysieren Sie ihre Ergebnisse, finden sie, dass die nicht-kodierenden Regionen des Genoms außerhalb der Gene, die früher als "junk" in unserem Erbgut als auch eine wichtige Rolle spielen.
Seit 2001, die Kosten der DNA-Sequenzierung, die ein menschliches Genom von Milliarden an Zehntausende von Dollar gesunken ermöglicht mehr gezielte Untersuchungen der Genexpression. Dies hat Wissenschaftler Fähigkeit zum Verständnis biologischer Systeme und ihre Beziehung zur Krankheit erheblich verbessert.
Viele weit verbreitete Krankheiten haben eine genetische Komponente, die prädisponiert zu krank geworden, aber die Verbindung ist selten einfach. Die Kombination der nächsten Generation gen Sequenzer und High-Performance-Computern ermöglichen es Biologen, neue Fragen zu unserer DNA und neue Erkenntnisse über die Krankheit und Vererbung aufzulesen.
Ein wichtiges Beispiel ist die Rolle der Transkription Faktor Proteine in der Genregulation, die Wissenschaftler nur zu erkunden beginnen. Diese Proteine binden an Landeplätze auf dem Genom und fungieren als Kontrolle für die Genregulation wählt – Gene ein- und ausschalten, und Festlegung der Höhe der Aktivität der Gene in einer Zelle.
"Wenn Sie normale Zellen zu Krebszellen vergleichen, wollen Sie wissen, was passiert in der Krebszelle, die macht es anders," sagte Vishy Iyer, an der University of Texas at Austin. "Die gen-Ausdruck-Muster zu ändern, und wir wollen wissen, welche Gene sind geregelt, nach oben oder unten, und wie es dazu kam."
Etwa 2.000 Transkription Faktor Proteine identifiziert worden, und einige haben, Brustkrebs und anderen Krebsarten, Rett-Syndrom und Autoimmunerkrankungen in Verbindung gebracht worden. Jedoch ist wenig bekannt, wie sie funktionieren.
Iyer, zusammen mit Kollegen an der Duke, The University of North Carolina-Chapel Hill und Hinxton, UK, versuchen, dies zu ändern. Ihre Forschung war veröffentlicht in der Zeitschrift Science im Jahr 2010, eine der ersten Studien, Next Generation Sequencing und Supercomputern zu verwenden, um die Expression von Genen im Zusammenhang mit einer spezifischen regulatorischen Transkriptionsfaktor (CTCF genannt) zu erkunden. Sie bestimmt, dass Transkription Faktor Bindung eine erbliche Eigenschaft ist.
"Wir zeigten zum ersten Mal, dass einige der Unterschiede in der DNA zwischen den Individuen die Bindung von Transkriptionsfaktoren, beeinflussen kann", sagte Iyer. "Noch wichtiger ist, die diese Unterschiede könnten geerbt."
Die Gruppe verwendet eine relativ neue Sequenzierungstechnologie, genannt ChIP-Seq, um nur die Bereiche der DNA zu studieren, an die interessierenden Proteine gebunden waren. Diese Basenpaare wurden dann sequenziert, um die Reihenfolge der Nukleotide ermitteln und zählen, wie viele Moleküle an das Protein gebunden waren.
Klingt einfach genug, bis Sie zu Folge Millionen von diesen Regionen, ihre exakte Position unter den ca. 3 Milliarden Basenpaare im menschlichen Genom zu finden versuchen.
"Das Genom ist ein riesiges Gebiet mit vielen Features," sagte Iyer. "Sie können die Proteine als Wahrzeichen, die wir auf der Genom-Karte platzieren möchten vorstellen."
Der Nationalfonds finanzierten Ranger Supercomputer am Texas Advanced Computing Center nahm die kurze Sequenz liest von ChIP-Seq generiert und an die Referenz-Genom ausgerichtet.
"Es ist wie eine Volltextsuche. Aber wenn Sie versuchen, führen Sie es in Microsoft Word, es nie fertig würde,"scherzte Iyer.
Mit mehreren tausend Prozessoren gleichzeitig auf Ranger, die Ausrichtung dauerte mehrere Stunden für jeden der Datensätze und insgesamt verwendet den Gegenwert von 20 Jahren auf einem einzelnen Prozessor.
Die einheitliche Basis Abwicklung von Next Generation Sequencing angeboten konnten die Forscher zu individuellen, bekannte Unterschiede in der DNA betrachten und diese Unterschiede können Sie prüfen, wie die Gene auf jedem Chromosom Transkriptionsfaktoren binden.
"Wir könnten sagen, der Unterschied im Einband aus das Gen, das Sie von Ihrem Vater und Mutter geerbt – das war der große Fortschritt," sagte Iyer. "Jetzt sind wir diese Technologie auf Fälle, wo Sie wissen, dass das Gen von einem Elternteil eine Mutation hat, die Sie bereits für einige Krankheiten verfügt über, anwenden."
Diese Erkenntnisse bringen Wissenschaft einen Schritt näher zur personalisierten Medizin auf einer detaillierten Lesung des Genoms einer Person basiert, einschließlich der nicht-kodierenden Regionen. Trotz der enormen Komplexität des Genoms ist Iyer optimistisch, dass die Forschung auf die menschliche Gesundheit auswirken wird.
"Es gibt viele Krankheiten und für eine Teilmenge, sie sind beeinflussen Genexpression von Auswirkungen auf die Transkriptionsfaktoren," sagte er. "Wenn wir die Krankheiten und die Faktoren intelligent auswählen, denke ich, finden wir sie."
Anmerkung der Redaktion: Dieser Forschung wurde unterstützt von der National Science Foundation (NSF), die Bundesagentur mit der Finanzierung von Grundlagenforschung und Ausbildung in allen Bereichen der Wissenschaft und Technik beauftragt. Meinungen, Erkenntnisse und Schlussfolgerungen oder Empfehlungen ausgedrückt in diesem Material sind die des Autors und spiegeln nicht unbedingt die Ansichten von der National Science Foundation. Siehe die hinter die Kulissen-Archiv.