zurĂŒck zum Artikel

KI fĂŒr autonomes Fahren: Teslas FSD-Chip vereint CPU, GPU und KI-Prozessor

Nico Ernst
Teslas FSD-Chip vereint CPU, GPU und KI

Nicht nur den schnellsten, gleich den besten Chip fĂŒr autonomes Fahren will Tesla gebaut haben. Das Design erscheint tatsĂ€chlich recht clever.

Im Rahmen eines Analysten-Events zum autonomen Fahren hat Telsa ausfĂŒhrlich seinen ersten selbst entwickelten Baustein fĂŒr die Steuerung seiner Autos vorgestellt. Der Chip wurde in knapp zwei Jahren entwickelt und trĂ€gt den Namen "Full Self Driving" – FSD.

Der Baustein wird in FinFET-Bauweise bei 14 Nanometern Strukturbreite von Samsung gefertigt. Das System-on-Chip wird inzwischen in alle aktuellen Tesla-Modelle ab Werk eingebaut und ersetzt dort das bisher genutzte Xavier-Design von Nvidia.

Tesla zufolge soll der FSD nur 80 Prozent des Xavier kosten, aber insgesamt 21 Mal so schnell bei der Verarbeitung von Sensordaten und den daraus resultierenden Fahrentscheidungen sein. Dabei vergleicht Tesla aber einen Xavier mit zwei FSD, denn zwei dieser Chips sind im neuen Fahrcomputer auf einem Board untergebracht. Bei der Entwicklung stand neben dem Tempo eine geringe Leistungsaufnahme im Vordergrund.

Tesla: "Full Self Driving" Chip (0 Bilder) [1]

[2]

Das wirkt sich nicht nur auf die Reichweite der Fahrzeuge aus, sondern dient auch dazu, den neuen FSD-Computer in einem fast unverĂ€nderten GehĂ€use weiterhin hinter dem Handschuhfach anzubringen. Mit Seitenhieb auf manche Forschungsprojekte sagte Teslas Halbleiterchef Pete Bannon: "Das belegt nicht den halben Kofferraum". Die NachrĂŒstung Ă€lterer Wagen ist also möglich, ab wann und zu welchen Kosten Tesla dies anbietet, steht noch nicht fest. Die bestehenden Teslas von Firmenmitarbeitern rĂŒstet das Unternehmen bereits zu Testzwecken seit Dezember 2018 mit dem FSD aus.

Die wichtigsten Designziele waren eine Rechenleistung von ĂŒber 50 Teraops (Tops) und unter 100 Watt Leistungsaufnahme fĂŒr den gesamten Rechner. Herausgekommen sind nun 144 Tops und 72 Watt. Die Entwicklung, die Ende 2016 startete, trĂ€gt unverkennbar die Handschrift von Chipdesigner Jim Keller, der Tesla Mitte 2018 verließ um bei Intel anzuheuern. Vor seiner Arbeit bei Tesla hatte er unter anderem bei Apple die ersten A-SoCs designed, und deren Konzept folgt auch der FSD: Bestehende Entwicklung, wie in beiden FĂ€llen ARM-Cores, werden um anwendungsspezifische Einheiten ergĂ€nzt.

Folglich arbeitet auch der FSD mit 12 Cortex-A72-Kernen mit bis zu 2,2 GHz, die vorwiegend zur Ansteuerung der Datenverarbeitung genutzt werden. Laut Pete Bannon sind die dafĂŒr entwickelten Einheiten eigene Entwicklungen, sie sind jeweils auf einen bestimmten Zweck optimiert. Da Tesla-Chef Elon Musk fĂŒr PKWs die LIDAR-Technik ablehnt, weil sie zu teuer und komplex ist, steht die Verarbeitung von Bilddaten im Vordergrund. Musk sagte: "Jeder, der sich auf LIDAR verlĂ€sst, ist dem Untergang geweiht".

Den Anfang der Verarbeitung macht im FSD ein Bildprozessor, der die 24-Bit-Daten der aktuell bis zu acht HDR-Kameras eines Fahrzeugs aufbereitet. Er filtert unter anderem Rauschen und passt die Farbwerte an, um kontrastreichere Bilder zu erhalten. Das lĂ€uft mit einer Milliarde Pixeln pro Sekunde (1 GPixel/s), die VideoeingĂ€nge des FSP könnten sogar 2,5 GPixel erfassen - Bannon verwies auf kĂŒnftige Sensoren. Vermutlich wird ein Teil der Bilddaten auch von der GPU behandelt, wozu sie sonst mit 1 GHz takten und 600 GFlops leisten soll, erklĂ€rte der Ingenieur nicht weiter.

Den grĂ¶ĂŸten Teil des FSD nimmt der KI-Beschleuniger ein, den Tesla "Neural Network Accelerator" (NAA) nennt. Zu seiner genauen Struktur Ă€ußerte sich Bannon nicht, es fĂ€llt also schwer, ihn beispielsweise mit Nvidias Tensor-Cores zu vergleichen. Nur, dass es ein Array von 96 Ă— 96 Multiply-Add-Rechenwerken gibt, erklĂ€rte Bannon. Den Die-Fotos zufolge scheint der NNA aus 2 Ă— 2 Funktionsblöcken zu bestehen, die insgesamt auf ganze 32 MByte SRAM – diese Zahl nannte der Designer – zugreifen können. Angesichts einer Die-GrĂ¶ĂŸe von nur 260 Quadratmillimetern ist das verglichen mit PC-Prozessoren sehr viel des schnellen Zwischenspeichers.

Er ist, so betonte Bannon mehrfach, hauptverantwortlich fĂŒr die hohe Leistung des Chips bei der statistischen Analyse von Daten, die heute KI genannt wird. Bis zu 1 Terabyte pro Sekunde soll das SRAM liefern können, darin werden nicht nur die in mehreren Layern von der Software erzeugten Informationen des neuronalen Netzes abgelegt – auch die Programme selbst sind im SRAM gespeichert. DafĂŒr hat sich Tesla ein eigenes Speichermanagement ausgedacht, das die in vorherigen Layern gebildeten Daten wieder verwirft, sobald sie nicht mehr gebraucht werden.

Die statischen Speicher werden bei KI-Anwendungen ebenso wie die Rechenwerke typischerweise recht heiß, weil sie stĂ€ndig unter Volllast stehen. Der FSD arbeitet in einem Tesla nĂ€mlich nicht nur, wenn das Auto selbst fĂ€hrt, sondern auch, um Daten beispielsweise fĂŒr den Notbremsassistenten bereitzustellen. WĂ€hrend der Lese- und SchreibvorgĂ€nge auf das SRAM werden die Funktionseinheiten also angehalten, dafĂŒr gibt es per Hardware kontrollierte Zyklen. Dennoch soll das System bei 2 GHz in jedem Takt 9216 Multiply-Adds erreichen, was 36,8 Tops ergibt, und da ein FSD zwei der NAA-Blöcke besitzt und der Rechner wiederum zwei FSDs, ergeben sich wohl die von Tesla zitierten 144 Tops – anhand der genannten Daten wĂ€ren es sogar 147,2 Tops.

Nicht nur fĂŒr die Leistung gibt es im neuen Rechnermodul der Teslas zwei FSD-Chips, sondern auch aus GrĂŒnden der Redundanz. Jeder der einzelnen FSDs darf ausfallen, ebenso seine jeweilige Stromversorgung – "und das Auto fĂ€hrt weiter" sagte Elon Musk. Er betonte auch, dass beide Systeme versagten, sei mindestens eine GrĂ¶ĂŸenordnung unwahrscheinlicher als dass ein menschlicher Fahrer das Bewusstsein verliere. Statistische Daten dafĂŒr legte er allerdings nicht vor. Wenn beide FSDs arbeiten, kontrollieren sie sich gegenseitig: Beide erhalten alle Sensordaten, fĂŒhren Berechnungen durch, und vergleichen vor einem Fahrbefehl ihrer Ergebnisse. Wie dabei dann eine Gewichtung vorgenommen wird, erklĂ€rte Tesla aber nicht.

Neben den genannten Einheiten besitzt der FSD noch ein LPDDR4-Interface fĂŒr das RAM, das wie ein Crossbar aus frĂŒheren CPU-Designs quer durch den ganzen Chip lĂ€uft. Dazu kommen noch zwei eigene Einheiten fĂŒr die Fehlererkennung im Baustein selbst (Lockstep-Verfahren) und ein Kryptograhie-Block, der nur die AusfĂŒhrung von durch Tesla signierter Software erlaubte. Überraschen mag vielleicht ein eigener H.265-Encoder fĂŒr Video sein – er dient aber, so erklĂ€rte Bannon, fĂŒr das komprimieren von Videodaten, die dann in die herstellereigene Cloud geladen werden. Das soll vor allem fĂŒr weiteres Training der neuronalen Netze dienen.

Das, so gab spĂ€ter auch Elon Musk an, sieht sein Unternehmen als grĂ¶ĂŸten Vorsprung auf dem Weg zum vollautonomen Auto an: Ende des laufenden Quartals sollen sich eine halbe Million Teslas auf den Straßen befinden. Musk geht offenbar davon aus, die ehrgeizigen Liefervorhersagen [3] auch erfĂŒllt werden. Mithilfe der von den Fahrzeugen gesammelten Daten soll die Software weiter verbessert werden, bisher spricht Tesla von "Autopilot 3.0" – der ist aber, wie bei allen anderen Herstellern auch, noch immer nicht fĂŒr das unbeaufsichtigte Fahren im Regelbetrieb zugelassen. (bme [4])


URL dieses Artikels:
https://www.heise.de/-4408291

Links in diesem Artikel:
[1] https://www.heise.de/bilderstrecke/2668428.html?back=4408291;back=4408291
[2] https://www.heise.de/bilderstrecke/2668428.html?back=4408291;back=4408291
[3] https://www.heise.de/news/Tesla-Verlust-im-ersten-Quartal-2019-4406959.html
[4] mailto:bme@heise.de