KI für autonomes Fahren: Teslas FSD-Chip vereint CPU, GPU und KI-Prozessor

26.04.2019 13:12 Uhr Nico Ernst

Nicht nur den schnellsten, gleich den besten Chip für autonomes Fahren will Tesla gebaut haben. Das Design erscheint tatsächlich recht clever.

Im Rahmen eines Analysten-Events zum autonomen Fahren hat Telsa ausführlich seinen ersten selbst entwickelten Baustein für die Steuerung seiner Autos vorgestellt. Der Chip wurde in knapp zwei Jahren entwickelt und trägt den Namen "Full Self Driving" – FSD.

Der Baustein wird in FinFET-Bauweise bei 14 Nanometern Strukturbreite von Samsung gefertigt. Das System-on-Chip wird inzwischen in alle aktuellen Tesla-Modelle ab Werk eingebaut und ersetzt dort das bisher genutzte Xavier-Design von Nvidia.

Tesla zufolge soll der FSD nur 80 Prozent des Xavier kosten, aber insgesamt 21 Mal so schnell bei der Verarbeitung von Sensordaten und den daraus resultierenden Fahrentscheidungen sein. Dabei vergleicht Tesla aber einen Xavier mit zwei FSD, denn zwei dieser Chips sind im neuen Fahrcomputer auf einem Board untergebracht. Bei der Entwicklung stand neben dem Tempo eine geringe Leistungsaufnahme im Vordergrund.

Tesla: "Full Self Driving" Chip (0 Bilder) [1]

[2]

Mehr Reichweite in gleichem Gehäuse

Das wirkt sich nicht nur auf die Reichweite der Fahrzeuge aus, sondern dient auch dazu, den neuen FSD-Computer in einem fast unveränderten Gehäuse weiterhin hinter dem Handschuhfach anzubringen. Mit Seitenhieb auf manche Forschungsprojekte sagte Teslas Halbleiterchef Pete Bannon: "Das belegt nicht den halben Kofferraum". Die Nachrüstung älterer Wagen ist also möglich, ab wann und zu welchen Kosten Tesla dies anbietet, steht noch nicht fest. Die bestehenden Teslas von Firmenmitarbeitern rüstet das Unternehmen bereits zu Testzwecken seit Dezember 2018 mit dem FSD aus.

Die wichtigsten Designziele waren eine Rechenleistung von über 50 Teraops (Tops) und unter 100 Watt Leistungsaufnahme für den gesamten Rechner. Herausgekommen sind nun 144 Tops und 72 Watt. Die Entwicklung, die Ende 2016 startete, trägt unverkennbar die Handschrift von Chipdesigner Jim Keller, der Tesla Mitte 2018 verließ um bei Intel anzuheuern. Vor seiner Arbeit bei Tesla hatte er unter anderem bei Apple die ersten A-SoCs designed, und deren Konzept folgt auch der FSD: Bestehende Entwicklung, wie in beiden Fällen ARM-Cores, werden um anwendungsspezifische Einheiten ergänzt.

Eine Milliarde Pixel pro Sekunde

Folglich arbeitet auch der FSD mit 12 Cortex-A72-Kernen mit bis zu 2,2 GHz, die vorwiegend zur Ansteuerung der Datenverarbeitung genutzt werden. Laut Pete Bannon sind die dafür entwickelten Einheiten eigene Entwicklungen, sie sind jeweils auf einen bestimmten Zweck optimiert. Da Tesla-Chef Elon Musk für PKWs die LIDAR-Technik ablehnt, weil sie zu teuer und komplex ist, steht die Verarbeitung von Bilddaten im Vordergrund. Musk sagte: "Jeder, der sich auf LIDAR verlässt, ist dem Untergang geweiht".

Den Anfang der Verarbeitung macht im FSD ein Bildprozessor, der die 24-Bit-Daten der aktuell bis zu acht HDR-Kameras eines Fahrzeugs aufbereitet. Er filtert unter anderem Rauschen und passt die Farbwerte an, um kontrastreichere Bilder zu erhalten. Das läuft mit einer Milliarde Pixeln pro Sekunde (1 GPixel/s), die Videoeingänge des FSP könnten sogar 2,5 GPixel erfassen - Bannon verwies auf künftige Sensoren. Vermutlich wird ein Teil der Bilddaten auch von der GPU behandelt, wozu sie sonst mit 1 GHz takten und 600 GFlops leisten soll, erklärte der Ingenieur nicht weiter.

Hohe KI-Leistung

Den größten Teil des FSD nimmt der KI-Beschleuniger ein, den Tesla "Neural Network Accelerator" (NAA) nennt. Zu seiner genauen Struktur äußerte sich Bannon nicht, es fällt also schwer, ihn beispielsweise mit Nvidias Tensor-Cores zu vergleichen. Nur, dass es ein Array von 96 × 96 Multiply-Add-Rechenwerken gibt, erklärte Bannon. Den Die-Fotos zufolge scheint der NNA aus 2 × 2 Funktionsblöcken zu bestehen, die insgesamt auf ganze 32 MByte SRAM – diese Zahl nannte der Designer – zugreifen können. Angesichts einer Die-Größe von nur 260 Quadratmillimetern ist das verglichen mit PC-Prozessoren sehr viel des schnellen Zwischenspeichers.

Er ist, so betonte Bannon mehrfach, hauptverantwortlich für die hohe Leistung des Chips bei der statistischen Analyse von Daten, die heute KI genannt wird. Bis zu 1 Terabyte pro Sekunde soll das SRAM liefern können, darin werden nicht nur die in mehreren Layern von der Software erzeugten Informationen des neuronalen Netzes abgelegt – auch die Programme selbst sind im SRAM gespeichert. Dafür hat sich Tesla ein eigenes Speichermanagement ausgedacht, das die in vorherigen Layern gebildeten Daten wieder verwirft, sobald sie nicht mehr gebraucht werden.

Ausfallsicherheit

Die statischen Speicher werden bei KI-Anwendungen ebenso wie die Rechenwerke typischerweise recht heiß, weil sie ständig unter Volllast stehen. Der FSD arbeitet in einem Tesla nämlich nicht nur, wenn das Auto selbst fährt, sondern auch, um Daten beispielsweise für den Notbremsassistenten bereitzustellen. Während der Lese- und Schreibvorgänge auf das SRAM werden die Funktionseinheiten also angehalten, dafür gibt es per Hardware kontrollierte Zyklen. Dennoch soll das System bei 2 GHz in jedem Takt 9216 Multiply-Adds erreichen, was 36,8 Tops ergibt, und da ein FSD zwei der NAA-Blöcke besitzt und der Rechner wiederum zwei FSDs, ergeben sich wohl die von Tesla zitierten 144 Tops – anhand der genannten Daten wären es sogar 147,2 Tops.

Nicht nur für die Leistung gibt es im neuen Rechnermodul der Teslas zwei FSD-Chips, sondern auch aus Gründen der Redundanz. Jeder der einzelnen FSDs darf ausfallen, ebenso seine jeweilige Stromversorgung – "und das Auto fährt weiter" sagte Elon Musk. Er betonte auch, dass beide Systeme versagten, sei mindestens eine Größenordnung unwahrscheinlicher als dass ein menschlicher Fahrer das Bewusstsein verliere. Statistische Daten dafür legte er allerdings nicht vor. Wenn beide FSDs arbeiten, kontrollieren sie sich gegenseitig: Beide erhalten alle Sensordaten, führen Berechnungen durch, und vergleichen vor einem Fahrbefehl ihrer Ergebnisse. Wie dabei dann eine Gewichtung vorgenommen wird, erklärte Tesla aber nicht.

Kryptograhie-Block erlaubt nur Tesla-Software

Neben den genannten Einheiten besitzt der FSD noch ein LPDDR4-Interface für das RAM, das wie ein Crossbar aus früheren CPU-Designs quer durch den ganzen Chip läuft. Dazu kommen noch zwei eigene Einheiten für die Fehlererkennung im Baustein selbst (Lockstep-Verfahren) und ein Kryptograhie-Block, der nur die Ausführung von durch Tesla signierter Software erlaubte. Überraschen mag vielleicht ein eigener H.265-Encoder für Video sein – er dient aber, so erklärte Bannon, für das komprimieren von Videodaten, die dann in die herstellereigene Cloud geladen werden. Das soll vor allem für weiteres Training der neuronalen Netze dienen.

Das, so gab später auch Elon Musk an, sieht sein Unternehmen als größten Vorsprung auf dem Weg zum vollautonomen Auto an: Ende des laufenden Quartals sollen sich eine halbe Million Teslas auf den Straßen befinden. Musk geht offenbar davon aus, die ehrgeizigen Liefervorhersagen [3] auch erfüllt werden. Mithilfe der von den Fahrzeugen gesammelten Daten soll die Software weiter verbessert werden, bisher spricht Tesla von "Autopilot 3.0" – der ist aber, wie bei allen anderen Herstellern auch, noch immer nicht für das unbeaufsichtigte Fahren im Regelbetrieb zugelassen. (bme [4])

URL dieses Artikels:
https://www.heise.de/-4408291

Links in diesem Artikel:
[1] https://www.heise.de/bilderstrecke/2668428.html?back=4408291;back=4408291
[2] https://www.heise.de/bilderstrecke/2668428.html?back=4408291;back=4408291
[3] https://www.heise.de/news/Tesla-Verlust-im-ersten-Quartal-2019-4406959.html
[4] mailto:bme@heise.de