Verteilter Supercomputer für besseres Maschinenlernen

Künstliche Intelligenz braucht zurzeit enorm viel Rechenleistung. Ein Pionier des verteilten Computing will jetzt bis zu einer Million Prozessorkerne über das Internet zusammenschalten, um schwierige Probleme relativ preiswert zu lösen.

vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Tom Simonite

Künstliche Intelligenz braucht zurzeit enorm viel Rechenleistung. Ein Pionier des verteilten Computing will jetzt bis zu einer Million Prozessorkerne über das Internet zusammenschalten, um schwierige Probleme relativ preiswert zu lösen.

Mit größeren und leistungsfähigeren Computersystemen für Maschinenlern-Software haben Unternehmen wie Google zuletzt bedeutende Fortschritte bei der Erkennung von Sprache und Bildern erreicht. Jetzt versucht ein eher kleines Unternehmen, das nicht börsennotierte Sentient mit 70 Beschäftigten, etwas Ähnliches: Es will noch größere Rechensysteme für Künstliche-Intelligenz-Software zu niedrigen Preisen zur Verfügung stellen.

Der Ansatz ist möglicherweise nicht für alle Arten von Maschinenlernen geeignet, das in so unterschiedlichen Bereichen wie Gesichtserkennung und Wertpapierhandel eingesetzt wird. Details hat Sentient noch nicht veröffentlicht, gibt aber an, bereits gezeigt zu haben, dass sich mit seinem Verfahren in manchen Fällen genügend Rechenleistung für bedeutende Ergebnisse zusammenstellen lässt.

Diese Leistung entsteht durch die Verbindung von Hunderttausenden Computern über das Internet, so dass sie zusammenarbeiten wie eine einzige große Maschine. Woher all die einzelnen Computer genau stammen, verrät Sentient nicht. Bei vielen davon handele es sich aber um Rechner mit ungenutzter Kapazität in Rechenzentren, also den Anlagen, die Rechenleistung für Internet-Dienste und mobile Apps zur Verfügung stellen, erklärt Babak Hodjat, Mitgründer und Chefwissenschaftler von Sentient. Die Betreiber von Rechenzentren werden für die Nutzung ihrer nicht ausgelasteten Computer bezahlt.

In Rechenzentren stehen oft viele ungenutzte Computer in Reserve, weil sie auch mit rapide ansteigender Nachfrage zurechtkommen müssen, im amerikanischen Einzelhandel etwa an Tagen wie dem sogenannten Black Friday, dem Freitag nach Thanksgiving. Sentient hat Software entwickelt, die Rechner an unterschiedlichen Standorten über das Internet zusammenschaltet, so dass auf ihnen Maschinenlern-Software laufen kann wie auf einem einzelnen, sehr leistungsfähigen Computer. Die Software ist so ausgelegt, dass die Daten so weitgehend wie möglich verschlüsselt bleiben. Dadurch bleiben die Berechnungen von Sentient – möglicherweise im Auftrag von Kunden – geheim.

Laut Adam Beberg, dem Chefarchitekten für verteiltes Computing bei Sentient, können auf diese Weise bis zu eine Million Prozessorkerne monatelang zusammen am selben Problem arbeiten. Nicht einmal die größten Maschinenlern-Systeme von Google würden bislang diese Dimension erreichen. Ein Google-Sprecher wollte auf Nachfrage keine Details zur Infrastruktur des Unternehmens nennen; wichtiger als die Größe der Computersysteme sei, welche Ergebnisse mit Maschinenlernen erzielt werden können. Google arbeitet in Bereichen wie Suche, Spracherkennung und Anzeigen-Targeting intensiv mit Maschinenlernen.

Beberg ist ein Pionier bei Bemühungen, Computer an unterschiedlichen Standorten für die gemeinsame Arbeit an einem Problem zusammenzuschalten. Er gehörte zu den Gründern von Distributed.net, einem der ersten Projekte, das diese Idee im großen Maßstab demonstrierte. Auf Grundlage dieser Technologie entstanden auch Projekte wie Seti@Home und Folding@Home, bei denen Millionen Menschen Software auf ihren PCs installierten, um bei der Suche nach außerirdischem Leben und in der Molekularforschung zu helfen.

Sentient wurde 2007 gegründet und hat bislang gut 140 Millionen Dollar an Finanzierung erhalten – mehr als 100 Millionen Dollar erst Ende vergangenen Jahres. Bislang konzentrierte sich das Unternehmen auf eine Maschinenlerntechnik namens evolutionäre Algorithmen, bei der auf der Grundlage einer anfänglichen Population von vielen leicht unterschiedlichen Algorithmen schrittweise eine Lösung für ein Problem entsteht: Die besten Varianten der ersten Generation werden zur Basis für die nächste, so dass die Lösungen von Generation zu Generation immer besser werden.

Geld verdient Sentient derzeit unter anderem mit dem Betrieb von Algorithmen für den Börsenhandel, die in einem monatelangen Prozess auf Hunderttausenden von Prozessoren entwickelt wurden. Jetzt aber will das Unternehmen seine Infrastruktur auch für Dienstleistungen in Branchen wie Gesundheit oder Online-Handel nutzen, erklärt Hodjat.

Vor kurzem hat Sentient versucht, seinen Ansatz für die Arbeit mit dem KI-Verfahren Deep Learning anzupassen. Diese Technik hat zuletzt bemerkenswerte Durchbrüche bei Bild- und Spracherkennung ermöglicht, so dass sie bei Unternehmen wie Google, Facebook und Baidu ins Zentrum der Arbeit mit Künstlicher Intelligenz gerückt ist. Einige der besten Ergebnisse kamen hier mittels Software zustande, die auf sehr leistungsfähigen, spezialisierten Computern ausgeführt wurde.

(sma)