KI fĂĽr autonomes Fahren: Teslas FSD-Chip vereint CPU, GPU und KI-Prozessor
Seite 2: Hohe KI-Leistung
Den größten Teil des FSD nimmt der KI-Beschleuniger ein, den Tesla "Neural Network Accelerator" (NAA) nennt. Zu seiner genauen Struktur äußerte sich Bannon nicht, es fällt also schwer, ihn beispielsweise mit Nvidias Tensor-Cores zu vergleichen. Nur, dass es ein Array von 96 × 96 Multiply-Add-Rechenwerken gibt, erklärte Bannon. Den Die-Fotos zufolge scheint der NNA aus 2 × 2 Funktionsblöcken zu bestehen, die insgesamt auf ganze 32 MByte SRAM – diese Zahl nannte der Designer – zugreifen können. Angesichts einer Die-Größe von nur 260 Quadratmillimetern ist das verglichen mit PC-Prozessoren sehr viel des schnellen Zwischenspeichers.
Er ist, so betonte Bannon mehrfach, hauptverantwortlich für die hohe Leistung des Chips bei der statistischen Analyse von Daten, die heute KI genannt wird. Bis zu 1 Terabyte pro Sekunde soll das SRAM liefern können, darin werden nicht nur die in mehreren Layern von der Software erzeugten Informationen des neuronalen Netzes abgelegt – auch die Programme selbst sind im SRAM gespeichert. Dafür hat sich Tesla ein eigenes Speichermanagement ausgedacht, das die in vorherigen Layern gebildeten Daten wieder verwirft, sobald sie nicht mehr gebraucht werden.
Ausfallsicherheit
Die statischen Speicher werden bei KI-Anwendungen ebenso wie die Rechenwerke typischerweise recht heiß, weil sie ständig unter Volllast stehen. Der FSD arbeitet in einem Tesla nämlich nicht nur, wenn das Auto selbst fährt, sondern auch, um Daten beispielsweise für den Notbremsassistenten bereitzustellen. Während der Lese- und Schreibvorgänge auf das SRAM werden die Funktionseinheiten also angehalten, dafür gibt es per Hardware kontrollierte Zyklen. Dennoch soll das System bei 2 GHz in jedem Takt 9216 Multiply-Adds erreichen, was 36,8 Tops ergibt, und da ein FSD zwei der NAA-Blöcke besitzt und der Rechner wiederum zwei FSDs, ergeben sich wohl die von Tesla zitierten 144 Tops – anhand der genannten Daten wären es sogar 147,2 Tops.
Nicht nur für die Leistung gibt es im neuen Rechnermodul der Teslas zwei FSD-Chips, sondern auch aus Gründen der Redundanz. Jeder der einzelnen FSDs darf ausfallen, ebenso seine jeweilige Stromversorgung – "und das Auto fährt weiter" sagte Elon Musk. Er betonte auch, dass beide Systeme versagten, sei mindestens eine Größenordnung unwahrscheinlicher als dass ein menschlicher Fahrer das Bewusstsein verliere. Statistische Daten dafür legte er allerdings nicht vor. Wenn beide FSDs arbeiten, kontrollieren sie sich gegenseitig: Beide erhalten alle Sensordaten, führen Berechnungen durch, und vergleichen vor einem Fahrbefehl ihrer Ergebnisse. Wie dabei dann eine Gewichtung vorgenommen wird, erklärte Tesla aber nicht.
Kryptograhie-Block erlaubt nur Tesla-Software
Neben den genannten Einheiten besitzt der FSD noch ein LPDDR4-Interface für das RAM, das wie ein Crossbar aus früheren CPU-Designs quer durch den ganzen Chip läuft. Dazu kommen noch zwei eigene Einheiten für die Fehlererkennung im Baustein selbst (Lockstep-Verfahren) und ein Kryptograhie-Block, der nur die Ausführung von durch Tesla signierter Software erlaubte. Überraschen mag vielleicht ein eigener H.265-Encoder für Video sein – er dient aber, so erklärte Bannon, für das komprimieren von Videodaten, die dann in die herstellereigene Cloud geladen werden. Das soll vor allem für weiteres Training der neuronalen Netze dienen.
Das, so gab später auch Elon Musk an, sieht sein Unternehmen als größten Vorsprung auf dem Weg zum vollautonomen Auto an: Ende des laufenden Quartals sollen sich eine halbe Million Teslas auf den Straßen befinden. Musk geht offenbar davon aus, die ehrgeizigen Liefervorhersagen auch erfüllt werden. Mithilfe der von den Fahrzeugen gesammelten Daten soll die Software weiter verbessert werden, bisher spricht Tesla von "Autopilot 3.0" – der ist aber, wie bei allen anderen Herstellern auch, noch immer nicht für das unbeaufsichtigte Fahren im Regelbetrieb zugelassen. (bme)