KI-Chips: Google bringt Trillium-TPUs in die Cloud

Mit einer viermal so großen Trainingsleistung wie der Vorgänger bewirbt Google seine aktuellen KI-Chips. Cloud-Kunden können jetzt Instanzen mit der TPU buchen.

vorlesen Druckansicht
Google-Schriftzug an weißer Wand

(Bild: testing/Shutterstock.com)

Lesezeit: 2 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Kunden der Google Cloud können ab sofort die sechste Generation der Trillium-TPUs nutzen. Der auch v6e genannte Chip kommt beim Training und der Bereitstellung von künstlicher Intelligenz zum Einsatz. Google verspricht im Verhältnis zur vorherigen Chip-Generation eine höhere Leistung, Bandbreite und Energieeffizienz. Bereits im Frühjahr hatte das Unternehmen die Chip-Generation angekündigt und nutzte sie seitdem bei der Entwicklung der zweiten Iteration des hauseigenen KI-Modells Gemini, das derzeit als experimentelle Version verfügbar ist.

Wie auch mit dem v5e-Chip können Kunden mit Trillium-TPUs Transformatoren, Text-zu-Bild-Generatoren und Convolutional Neural Networks trainieren, abstimmen und bereitstellen. Im Verhältnis zum Vorgänger sollen die Leistungsdaten der Trillium-TPU eine viermal so große Trainingsleistung von KI-Modellen und einen dreifachen Inferenzdurchsatz ermöglichen. Gleichzeitig bewirbt Google die v6e-Beschleuniger mit einer um 67 Prozent höheren Energieeffizienz.

Google beziffert die Rechenleistung für 16-Bit-Gleitkommazahlen für Trillium-Beschleuniger mit 918 Teraflops, v5e-Chips erreichen 197 Teraflops. Ein v6e-Pod mit 256 Chips kommt so auf etwa 235 Petaflops. Die Werte für 8-Bit-Integer-Berechnungen sind doppelt so hoch. Mit einer Kapazität von 32 Gigabyte und einer Bandbreite von 1,6 Terabit pro Sekunde verdoppelte Google die Werte des High Bandwidth Memory. Jeder Trillium-Chip verfügt über einen Tensor Core mit zwei Einheiten für Matrixmultiplikation (MXU) und je einer Vektor- und Skalareinheit. Die Tensor Cores des v5e-Chips enthalten vier MXUs.

Videos by heise

In Europa bietet Google Trillium-Instanzen im Rechenzentrum Amsterdam an. On-Demand kostet eine Chipstunde 2,97 US-Dollar. Bei einer zugesicherten Nutzung von einem Jahr liegt der Preis bei 2,08 US-Dollar, bei drei Jahren sind es 1,34 US-Dollar. Instanzen mit dem Vorgänger v5e kosten etwa halb so viel. Für Spot-VMs gelten dynamische Preise. Weitere Standorte der Trillium-Instanzen sind derzeit South Carolina, Ohio und Tokio.

(sfe)