Petabyte pro Gramm

DNA-Speicher sollen die lawinenartig ansteigenden Datenmengen des Internetzeitalters speichern. In diesem Jahr könnte die Technologie entscheidende Fortschritte machen.

18.04.2017, 06:00 Uhr

Lesezeit: 4 Min.

MIT Technology Review

Von

Dr. Wolfgang Stieler

DNA-Moleküle sind gewissermaßen Festplatten – nur eben für Lebewesen. Warum sie also nicht als Datenspeicher für das Computerzeitalter nutzen? Das Konzept ist verlockend: Erbgutspeicher würden es ermöglichen, Daten eine Million Mal dichter zu packen als in aktuellen Festplatten. Ein Petabyte, also eine Million Gigabyte Daten kann man theoretisch in einem Gramm DNA-Pulver speichern.

500 Gramm dieser Substanz würden reichen, um den Speicherbedarf eines weltweit agierenden Unternehmens wie Dropbox zu befriedigen.

Theoretisch – noch hat niemand solche großen Datenmengen in DNA gespeichert. Bisher scheiterte die Realisierung an technischen Problemen. Doch das ändert sich gerade. Die jüngsten Forschungserfolge auf diesem Gebiet stimmen sehr optimistisch. Ende April 2016 vermeldete die Forschungsabteilung von Microsoft, man habe gemeinsam mit Forschern der University of Washington 200 Megabyte Daten in DNA gespeichert und wieder ausgelesen. Details hat Microsoft zwar nicht veröffentlicht, aber damit auf einen Schlag den Weltrekord um mehr als das Zweihundertfache überboten. Bis dahin lag die größte in DNA gespeicherte Datenmenge der Welt bei 739 Kilobyte.

TR 1/2017 — (Bild:
Technology Review 1/17
)

Dieser Artikel stammt aus dem Januar-Heft von Technology Review. Weitere Themen der Ausgabe:

Olgica Milenkovic und Kollegen von der University of Illinois haben vor Kurzem sogar einen wiederbeschreibbaren DNA-Speicher entwickelt. Sie lasen Daten mithilfe von PCR aus und schrieben die Sequenzen dann mit der Genschere CRISPR/Cas9 um.

Und im März dieses Jahres gelang es Forschern der Columbia University in New York, unter anderem einen französischen Kurzfilm, ein Computer-Betriebssystem, eine Geschenk-Karte von Amazon im Wert von 50 Dollar und einen Computer-Virus kodiert als DNA zu hinterlegen. Insgesamt sechs Dateien speicherten sie – und lasen sie auch wieder aus.

Der Erfolg stimmte die Branche offenbar optimistisch. Im Juni 2016 trafen sich auf Einladung der Semiconductor Research Corporation – einem Forschungskonsortium der Halbleiterindustrie – Vertreter von Microsoft, Intel, IBM, Forschungseinrichtungen wie dem NIST und dem MIT sowie Biotech-Unternehmen, um die Entwicklung von DNA-Speichersystemen ernsthaft zu diskutieren. In diesem Jahr wird sich auf dem Feld also einiges tun – auch wenn der erste Prototyp eines DNA-Massenspeichers noch etwas weiter weg ist. Laut IEEE Spectrum sehen die Beteiligten des Treffens ihn in fünf bis sieben Jahren.

Denn eigentlich ist der Prozess recht einfach: Computerdaten, also die Abfolge von Nullen und Einsen, werden in die vier Erbgutbausteine A, C, G und T übersetzt – die sogenannten Basen. Eine Synthesemaschine fügt dies dann zum DNA-Molekül zusammen. Die Reihenfolge der Basen codiert den Informationsinhalt.

Dabei müssen die Forscher drei Probleme lösen. Erstens: Gängige Syntheseverfahren können keine beliebig langen DNA-Streifen herstellen. Nach maximal 200 Basen ist Schluss. Dieses Problem löst man, indem man an das Ende jedes Streifens eine Nummer einfügt, um die einzelnen Datenstücke dann wieder zusammensetzen zu können.

Zweitens: Im Schnitt bauen Synthesemaschinen alle 100 Basen einen Fehler ein. Die britischen Bioinformatiker Nick Goldman und Ewan Birney vom European Bioinformatics Institute in Hinxton veröffentlichten 2013 jedoch eine erste Lösung: Die Zeichenfolgen auf den Genstreifen werden so geschrieben, dass sich die Sequenzen überlappen. Seither sind weitere Mechanismen zur Fehlerkorrektur entwickelt worden.

Drittens: der hohe Preis für das Synthetisieren der DNA. Es gibt nur wenige Firmen wie zum Beispiel Twist Bioscience, die auch die Sequenzen für Microsoft hergestellt haben. Nach Schätzungen von Experten muss der Preis für die Synthese um den Faktor 10000 fallen, damit DNA-Speicher marktfähig wird.

Aber auch dieses Problem könnte schon bald geknackt werden: Seth Shipman und Jeff Nivala von der Harvard University haben Daten im Genom eines lebendigen Bakteriums gespeichert, indem sie auf clevere Art und Weise die Virenabwehr der Bakterien nutzen. Die so gespeicherte Datenmenge war zwar äußert klein, die Forscher mussten aber keine DNA synthetisieren. (wst)