Warum würde ich Google Put My Genom in der Cloud lassen
Für die vergangenen 18 Monate nach der Tech Reviewhat Google ruhig, eine Cloud computing-Service für DNA gerollt. Google Genomics könnte eines Tages Millionen von Genomen auf seinen Servern, bei einem Klick auf eine Schaltfläche den Forschern zur Verfügung haben. Gibt es berechtigte Datenschutzbedenken hier? Auf jeden Fall, aber es ist nicht Googles schmuddeligen Fingern Sie kümmern sollte.
Genetischen Datenbanken existieren bereits online, natürlich, und Google Genomics ist nur der jüngste (und ehrgeizigste) Iteration. Es gibt Genealogie-Datenbanken für die Suche nach Ihren Vorfahren und lange verschollenen Verwandten. Es gibt öffentlich verfügbaren genetischen Datenbanken laufen von nationalen Forschungszentren. Und es gibt Dutzende von Datasets von Forschungsgruppen auf einer Schachtel-durchschachtel Grundlage mit anderen geteilt.
Google Genomics geht Forschungszentren und Universitäten bieten ihren Genomsequenzen für $25 pro Pop jedes Jahr Gastgeber herum. Weitere Genome kann es in einem zentralen Repository sammeln desto leichter wäre es für Forscher, ihre Daten zu teilen.
Warum Google Genomics könnte eine große Sache sein.
Eine Genomsequenz allein ist nutzlos. Ohne es mit anderen zu vergleichen, Sie weiß nicht, was ist eine Mutation oder was normal ist. Nehmen zwei Genome, und Sie können beginnen, die eine Vorstellung, aber Sie werden immer noch von den Hunderten von Variationen überschwemmt werden. Mit einer Datenbank von Dutzenden, hundert, tausend von Genomen, erhalten Sie eine viel bessere Chance der Lokalisierung. Je größer die Datenbank, desto besser.
Genom-Sequenzierung wird nur immer billiger und einfacher, aber teilen diese viele Terabyte an Daten hat nicht. Ihre Größe ist unhandlich, und verschiedene Datasets sind verstreut in verschiedenen Forschungsgruppen, die oft auf ein Fall von Basis-Basis verfügbar. Im Gegensatz dazu will Google eine zentrale Datenbank aufzubauen, wo ein Forscher gleichzeitig Millionen von Genomsequenzen Abfragen können. Dies ist die Infrastruktur für die personalisierte Medizin.
Nehmen wir an, Ihr Kind entpuppt sich als eine seltene und mysteriöse Erbkrankheit haben. Oder angenommen, Sie kommen ins Krankenhaus an Krebs. Durch den Vergleich einer Genomsequenz für Millionen von anderen in einer Datenbank, können wir beginnen, entwirren wie Menschen am besten zu behandeln.
... Wenn sie Privatsphäre lösen können
Wie immer, kommen mit big Data große Datenschutzprobleme. Genom-Datenbanken müssen sorgfältig wieviel Informationen kalibrieren sie zusammen mit den DNA-Sequenzen zur Verfügung stellen. Je mehr Informationen (Alter, Geschlecht, Ort, Rauchgewohnheiten, Etc etc.), desto nützlicher ist es, Forscher. Aber je mehr Informationen, desto leichter ist es zu ermitteln, wem das Genom gehört.
Letztes Jahr in der Wissenschaft, eine Studie konnte z. B. mehrere Männer aus dem öffentlich zugänglichen 1000 Genome Projekt basierend auf ihre y-Chromosomen und Alter, Standort und Stammbaum-Daten identifizieren. Während Google Genomicss Daten an Forscher und nicht die breite Öffentlichkeit richten scheint, macht ermöglicht die breite sharing von Genomen diese Bedenken viel drängender.
Oder stellen Sie sich ein Szenario, in dem Sie stimmen zu, Sequenzierung Ihres Genoms für eine Krebs-Studie. Ihr Genom wird an eine zentrale Datenbank, wo andere Forscher arbeiten an anderen Studien versehentlich herauszufinden, Sie haben eine neu entdeckte seltene Krankheit oder einem unbekannten Geschwister hochgeladen. Sollten sie Ihnen sagen?
Diese Privatsphäre sorgen nicht nur für Google Genomics natürlich, aber das schiere Ausmaß der anvisierten Datenbank vergrößert die potenziellen Probleme. Forscher haben für zentrale Genomdaten Zentren befürwortet, wenn nicht unbedingt beibehalten von Google, "Privacy Policies" mindestens zu standardisieren. Wenn Google Genomics erfolgreich ist, wird es sein, denn es zwingt uns mit Fragen der Privatsphäre zu rechnen, die hinter die Sequenzierung des Genoms.