Genforscher verlassen sich zu sehr auf Computer

Amerikanische Wissenschaftler entdeckten viele Fehler in dem vom Unternehmen Celera veröffentlichten Genom der Taufliege Drosophila.

vorlesen Druckansicht 59 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Florian Rötzer

Im Februar publizierten die Konkurrenten des durch öffentliche Gelder finanzierten Humangenomprojekts (HGP) und das von Craig Venter geleitete Unternehmen Celera ihre Versionen des kartierten menschlichen Genoms in verschiedenen wissenschaftlichen Publikationen. Celera hatte das HGP nicht nur mit den schnelleren Sequenzierungsmaschinen in Bedrängnis gesetzt, sondern auch angekündigt, die Kartierung mit einer anderen Methode – der so genannten "Schrotschussmethode" – sehr viel schneller leisten zu können. Dabei wird die DNA in einem Schritt in viele kleine Teile zerlegt, die dann parallel analysiert werden. Mit Hilfe von statistischen Verfahren versuchen die Forscher anschließend, die gefundenen Sequenz-Daten in der richtigen Reihenfolge zusammenzusetzen.

Celera musste schließlich auf die öffentlich zugänglichen Daten des HGP zur Vervollständigung zurückgreifen, woraus Kritiker schlossen, dass durch das Schrotschussverfahren zu viele Fehler erzeugt werden. War das bislang eher eine Vermutung, doch jetzt haben amerikanische Wissenschaftler der Stanford University das im letzten Jahr von Celera mit derselben Methode fertig gestellte Genom der Taufliege Drosophila noch einmal näher untersucht. Von Drosophila – dem Lieblingstier der Genetiker – sind viele Gene durch Experimente beschrieben worden: Solche bekannten DNA-Sequenzen verglichen die Wissenschaftler mit den Sequenzen von Celera. Wie sie jetzt in Nature ( Vol 411, 17. Mai 2001, S. 259) schreiben, fanden sie dabei heraus, dass 45 Prozent große Unterschiede aufwiesen, die auf Fehler bei der Interpretation der Daten – der Annotation – oder auf das Fehlen von Daten zurückgehen. Die Vermutung liegt nahe, dass die Fehlerquote beim menschlichen Genom ähnlich hoch sein dürfte.

Allerdings lasten die Wissenschaftler diese Mängel nicht nur Celera an, sondern sehen ein allgemeines Problem in den bioinformatischen Programmen zur Erkennung von Genen. Die unterschiedlichen Verfahren, mit denen Gene durch Programme in den sequenzierten Daten gesucht werden, hätten alle ihre Schwächen. Manche vergleichen anhand von Datenbanken Eigenschaften von Proteinsequenzen, aber völlig unbekannte Gene können damit nicht entdeckt werden. Die Wissenschaftler sagen, dass die erst wirklich interessante Interpretation der Rohdaten, also die Annotation der sequenzierten Gene bei Eukaryoten, trotz der mehr als 20 unterschiedlichen Programme, die es derzeit gebe, noch keineswegs zur Zufriedenheit gelöst sei: "Die Vorhersage, die einzig auf der Grundlage von statistischen Methoden und der Suche nach Homologien beruht, kann sich als ungeeignet erweisen, sodass experimentell gewonnene Ergänzungen notwendig werden." Es bestehe die Gefahr im Bereich der Genforschung, sich zu sehr auf die Computer zu verlassen, um Experimente zu vermeiden.

Mehr in Telepolis: Wie viele Gene hat der Mensch? (fr)