KI-Update kompakt: Waymo, Aurora, Moshi, KI-Ampeln

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 8 Min.
Von
Inhaltsverzeichnis

In Phoenix ist ein selbstfahrendes Auto von Waymo als Geisterfahrer unterwegs gewesen. Es überfuhr eine rote Ampel und kam erst auf einem Parkplatz zum Stoppen, wo Polizeibeamte den Supportmitarbeiter des Fahrzeugs erreichen konnten. Laut einem Sprecher von Waymo sei die Baustellenbeschilderung uneinheitlich gewesen und habe das Auto sogar daran gehindert, auf die richtige Spur zurückzukehren. Der Vorfall dauerte insgesamt nur rund eine Minute.

Derzeit werden von der National Highway Traffic Safety Administration (NHTSA) mehr als 25 Vorfälle mit Waymo-Fahrzeugen untersucht. Diese betreffen Fahren in den Gegenverkehr, Kollisionen mit parkenden Autos und feststehenden Objekten sowie die Missachtung von Verkehrsregeln. Wegen einiger Unfälle hat Waymo eine Rückruf-Aktion für Software-Updates gestartet. Unfälle wurden auf Fehler in Karten und Codes zurückgeführt.

Ein Forschungsteam von Microsoft Research AI for Science hat gemeinsam mit internationalen Partnern die KI Aurora vorgestellt. Sie ist das erste Foundation Model für die Erdatmosphäre und soll globale Vorhersagen für Wetter und Luftverschmutzung schneller berechnen können als herkömmliche Systeme. Das Modell verwendet 1,3 Milliarden Parameter und wurde mit Daten aus sechs Wetter- und Klimadatensätzen vortrainiert.

Aurora ist das erste KI-Modell, das die globale Luftverschmutzung für fünf Tage in weniger als einer Minute vorhersagen kann. Dabei ist es um Größenordnungen schneller als konventionelle Modelle. Auch globale 10-Tage-Wettervorhersagen sind möglich, bei 5000-fach höherer Rechengeschwindigkeit im Vergleich zu traditionellen Methoden. Im direkten Vergleich zu Googles GraphCast lieferte Aurora meist zuverlässigere Ergebnisse.

Präzise Wettervorhersagen gewinnen angesichts zunehmender Extremwetterereignisse an Bedeutung. Aurora soll in der Lage sein, das Ausmaß und die Schwere einzelner Ereignisse vorherzusagen und könnte so als Frühwarnsystem dienen. Allerdings ist die Vorhersage von Ereignissen wie Wirbelstürmen aufgrund ihrer schnellen Intensivierung selbst für fortschrittliche KI-Modelle eine Herausforderung.

Das französische KI-Start-up Kyutai hat in Paris seinen neuen KI-Assistenten Moshi vorgestellt. Moshi ist der erste öffentlich zugängliche Assistent, der natürliche Gespräche in Echtzeit führen kann. OpenAI hat diese Funktion für GPT-4o vorgestellt, aber noch nicht veröffentlicht. Aktuell hat Moshi eine beeindruckend geringe Latenz von 200 bis 240 Millisekunden – in der Praxis bedeutet das, dass das Modell nicht nur sofort auf Fragen des Nutzers antworten, sondern ihn auch mal unterbrechen kann.

Da das zugrundeliegende Sprachmodell mit 7 Milliarden Parametern recht klein ist, weist es im Dialog die üblichen Einschränkungen kleiner Modelle auf, also fehlerhafte Antworten, ein geringes Kontextverständnis und andere Probleme. Dennoch sind die Sprachfähigkeiten und die Geschwindigkeit beeindruckend und lassen das Potenzial erahnen, wenn leistungsfähigere und größere Modelle mit dieser Technik zum Einsatz kommen.

Kyutai sieht in Moshi ein großes Potenzial, insbesondere für die Barrierefreiheit. Eine Demo ist ab sofort online verfügbar. In den nächsten Monaten will das Start-up die Technik als Open Source veröffentlichen, damit Entwickler und Forscher sie weiterentwickeln können. Kyutai wurde 2023 gegründet und erhielt im vergangenen November 300 Millionen Euro von französischen Milliardären. Als wissenschaftliche Berater konnte Kyutai unter anderem Metas KI-Chef Yann LeCun gewinnen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Mit Stable Diffusion hat Stability AI einst den Standard für quelloffene KI-Bildgeneratoren gesetzt. Doch die neueste Version "Stable Diffusion 3 Medium" konnte die hohen Erwartungen der Community bisher nicht erfüllen. Nach der Veröffentlichung gab es viel Kritik, unter anderem wegen Problemen bei der Generierung bestimmter Motive und veränderter Lizenzen. Stability AI räumt nun Fehler ein: Sowohl die Qualität als auch die Kommunikation der neuen Lizenzbedingungen seien nicht optimal gewesen.

Erste interne Tests hätten zwar Verbesserungen gezeigt, doch die Nutzenden fanden schnell Schwachstellen, etwa bei seltenen Wörtern oder Körperhaltungen. Das Start-up arbeitet nach eigenen Angaben mit Hochdruck an einer überarbeiteten Version, die in den nächsten Wochen erscheinen soll. Auch bei den Nutzungsrechten hat Stability AI nachgebessert: Für nicht-kommerzielle Zwecke sowie für Unternehmen mit einem Jahresumsatz unter einer Million US-Dollar bleibt die Verwendung von Stable Diffusion kostenlos. Dies gelte auch für Forschung mit dem Modell. Erst bei höheren Umsätzen wird eine kostenpflichtige Enterprise-Lizenz fällig.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Eine Analyse von Cloudflare zeigt: Die aktivsten KI-Webcrawler im Internet sind Bytespider von Bytedance, gefolgt von Amazonbot und ClaudeBot von Anthropic. Bytespider und der GPTBot von OpenAI crawlen zudem die meisten Websites. Doch nur wenige Seitenbetreiber sind sich des Ausmaßes bewusst und ergreifen Gegenmaßnahmen. Im Juni durchsuchten KI-Bots laut Cloudflare rund 39 Prozent der eine Million populärsten Domains. Aber nur knapp 3 Prozent dieser Websites blockierten oder filterten die Anfragen.

Je höher eine Seite gerankt ist, desto wahrscheinlicher ist sie Ziel von KI-Bots und blockiert diese auch. Das liegt vermutlich daran, dass bei populären Seiten die Inhalte oft das Kerngeschäft darstellen und mehr Ressourcen für Schutzmaßnahmen vorhanden sind. Cloudflare beobachtet zudem, dass sich KI-Bots zunehmend als normale Browser tarnen, um Zugriff auf Inhalte zu erhalten. Das Unternehmen bietet Website-Betreibern nun Hilfe: Über das Dashboard lassen sich alle bekannten KI-Crawler mit einem Klick blockieren. Außerdem gibt es jetzt ein Reporting-Tool, mit dem man neue verdächtige Bots an Cloudflare melden kann.

Ellwangen in Baden-Württemberg testet von Juli bis Jahresende 2024 eine neuartige Verkehrssteuerung. Zwölf Ampelanlagen entlang der B290 und der Südtangente werden von Technik von Yunex (ehemals Siemens Mobility) gesteuert. Die 200.000 Euro Kosten trägt das Land. Nach dem Test sollen die Ergebnisse ausgewertet und Empfehlungen für andere Städte gegeben werden.

Das System erfasst den Verkehr mit Radar und Induktionsschleifen in Echtzeit und erstellt einen "digitalen Zwilling". Mit aktuellen und historischen Daten wird der Verkehr innerhalb einiger Stunden prognostiziert. Die Ampeln werden dann entsprechend des aufkommenden Bedarfs gesteuert. Neben dem motorisierten Individualverkehr werden auch ÖPNV, Radfahrer und Fußgänger berücksichtigt.

WhatsApp testet momentan neue KI-Funktionen innerhalb der Messaging-App. In einer aktuellen Beta-Version von WhatsApp können Nutzer Bilder von einer KI untersuchen und auf Wunsch auch ändern lassen. Damit können etwa Objekte auf Bildern identifiziert oder ungewünschte Objekte von Bildern entfernt werden.

Betreiber Meta Platforms bietet dafür einen eigenen Kanal namens "Meta AI" an, dem die Bilder mit den entsprechenden Fragen oder Anforderungen geschickt werden. Das ist bereits die zweite neue KI-Funktion innerhalb weniger Tage für die Messaging-App, denn kürzlich erst erschien eine andere Beta-Version von WhatsApp mit einer KI-Funktion für personalisierte Avatare.

Bisher ist Meta AI allerdings nicht in der EU und somit auch nicht in Deutschland verfügbar. Damit dürfte es noch dauern, bis die Bilderuntersuchungen und -änderungen per KI innerhalb WhatsApps auch hierzulande möglich sein werden.

Bundestrainer Julian Nagelsmann hat nach dem Ausscheiden der deutschen Herren-Nationalmannschaft im EM-Viertelfinale gegen Spanien den Einsatz von künstlicher Intelligenz zur Bewertung von Handspielen und Torschüssen gefordert. In der Pressekonferenz nach dem Spiel kritisierte Nagelsmann die derzeitige Handhabung von Handspielsituationen und schlug vor, KI-Technologie zu nutzen, um künftig präzisere und fairere Entscheidungen zu treffen.

Vorausgegangen war eine Situation, in der die Hand des spanischen Abwehrspielers Marc Curucella den Torschuss von Jamal Musiala im Strafraum abblockte. Der englische Schiedsrichter Anthony Taylor ließ trotz Protesten weiterspielen, ohne die Szene vom Video Assistant Referee überprüfen zu lassen.

Nagelsmann betonte, er wolle gar nicht herumjammern, sondern die Bühne der Presskonferenz nutzen, um die Regeln für künftige Turniere und Spiele anzupassen. "Es wäre schön, wenn man irgendwie bewerten würde, was mit dem Ball auch passiert." Er argumentierte, dass KI helfen könnte, zwischen Handspielen zu unterscheiden, die einen Torschuss verhindern, und solchen, die keinen Einfluss auf das Spielgeschehen haben.

(igr)