Google DeepVariant: Open Source für die Genom-Analyse

Die KI-Software DeepVariant setzt Daten aus einem Genomsequenzierer besonders fehlerarm zum kompletten Genom zusammen und läuft auch in der Google-Cloud.

In Pocket speichern vorlesen Druckansicht 20 Kommentare lesen
Google DeepVariant

Google DeepVariant

(Bild: Google Brain Team)

Lesezeit: 1 Min.

Das Genomics-Team von Google Brain gibt die Künstliche-Intelligenz-Software DeepVariant als Open Source frei. Die KI auf Basis von TensorFlow verarbeitet Datensätze aus industriellen Genomsequenzierern und setzt daraus das tatsächliche Genom zusammen. In einem Algorithmen-Wettbewerb der US-amerikanischen FDA bewährte sich DeepVariant mit besonders niedriger Fehlerwahrscheinlichkeit.

DeepVariant steht auch in Google Cloud bereit, und zwar in zwei Implementierungen: optimiert für hohe Geschwindigkeit oder niedrige Kosten. Laut Google dauert ein DeepVariant-Lauf auf Sequenziererdaten eines menschlichen Genoms mit 30-facher Abdeckung (30x Coverage) in der kostengünstigen Version drei bis vier Stunden und kostet etwa 8 bis 9 US-Dollar. Die schnelle Variante für etwa 35 US-Dollar braucht 1,5 bis 2 Stunden.

Hochdurchsatzsequenzierer (High-Throughput Sequencers, HTS) scannen laut Google rund 1 Milliarde kurze Sequenzen von je 100 der insgesamt 3 Milliarden Basenpaare eines menschlichen Genoms. Aus diesen Daten versuchen Algorithmen anschließend, das vollständige Genom zu rekonstruieren.

In Google Cloud läuft die billigere Version von DeepVariant auf 1025 Prozessorkernen. Die teurere nutzt ebenfalls so viele, aber im Zwischenschritt call_variants auch GPU-Beschleunigung (Tesla K80). (ciw)