KI-Update kompakt: Smart Cities, Hermes 3, Rentabilität, Nvidia

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 10 Min.
Von
Inhaltsverzeichnis

Viele Kommunen in Hessen wollen sich zu "Smart Cities" entwickeln. Dabei geht es um den Einsatz digitaler Lösungen, um die Infrastruktur und Daseinsfürsorge effizienter zu gestalten. In Fulda sollen Sensoren an Bussen deren Auslastung und Pünktlichkeit in Echtzeit übermitteln. Marburg plant Sensoren zur Belegung von Behindertenparkplätzen. In Darmstadt soll ein KI-gestützter Ampelphasenassistent den Verkehrsfluss verbessern. Smarte Bewässerung von Bäumen und Grünflächen durch Bodenfeuchtigkeitssensoren ist in mehreren Städten geplant. Auch bei der Abfallentsorgung kommen Sensoren zum Einsatz, die Füllstände messen. Der Kreis Fulda setzt ein Frühwarnsystem mit 200 Sensoren gegen Starkregen ein. In Bad Nauheim kategorisieren Sensoren Lärmquellen für die Hilfspolizei. Weitere Projekte sind ein digitales Bauamt in Fulda, ein zentraler Bürgerservice in Kassel und digitale Hilfsangebote für Senioren.

Google testet derweil mit dem Projekt "Green Light" KI-optimierte Ampelschaltungen in mehreren Städten weltweit, darunter Hamburg. Ziel ist, den Verkehrsfluss zu verbessern und CO2-Emissionen zu senken. Basis sind Verkehrsdaten von Google Maps, die als "mobile Sensoren" fungieren. Laut Google deuten erste Ergebnisse auf bis zu 30% weniger Stopps und 10% weniger Emissionen hin.

Experten sehen die Resultate zurückhaltender. Aufgrund veralteter Daten als Vergleichsbasis seien die Einsparungen geringer. Zudem entfallen nur 2% der verkehrsbedingten Emissionen in den USA auf wartende Fahrzeuge. Fahrende Autos verbrauchen mehr Sprit. Auch ignoriert das System Faktoren wie Busspuren und Fußgänger.

In einigen Städten wurden Googles Empfehlungen daher nicht umgesetzt oder zurückgenommen, da sie keinen Vorteil brachten oder sogar kontraproduktiv waren. Insgesamt zeigt sich, dass lernende Ampeln nicht immer schlauer sind als bisherige Systeme.

Die Stadt San Francisco hat eine Klage gegen die Betreiber von 16 Websites eingereicht, die das KI-gestützte Entkleiden von Personen auf Bildern anbieten. Den Angeklagten wird zur Last gelegt, mit den "Deep Nudes" oder auch "Deep Fake Pornography" genannten Erzeugnissen gegen US-Gesetze und Gesetze des Staates Kalifornien zu verstoßen, die unter anderem Rachepornografie und Kinderpornografie untersagen. Die beklagten Websites hätten alleine in den ersten sechs Monaten dieses Jahres über 200 Millionen Besuche gezählt. Nutzer laden dort Bilder bekleideter Personen hoch und können diese – in der Regel kostenpflichtig – "entkleiden" lassen.

Ziel der Klage sei es, solche Dienste abzuschalten, die Betreiber zu Strafzahlungen zu verurteilen und deren Tun dauerhaft durch Abschreckung zu verhindern. Solche Websites seien ein enormes globales Problem und die Opfer hilflos. Bestrebungen, gegen solche Anbieter vorzugehen, gibt es auch bereits in anderen Ländern. Großbritannien etwa will nach der Verbreitung auch die Erzeugung solcher Bilder unter Strafe stellen.

Google weitet seine KI-generierten Antworttexte namens "AI Overviews" auf sechs weitere Länder aus, darunter Großbritannien, Indien und Japan. In der EU bleiben sie weiterhin nicht verfügbar, was Google mit regulatorischen Unsicherheiten begründet. Manche sehen darin einen Versuch, Druck auf die Gesetzgeber auszuüben.

Laut Google führen die AI Overviews zu mehr Fragen der Nutzer und einer tieferen Auseinandersetzung mit komplexen Themen. Dadurch ergeben sich mehr Möglichkeiten für Verlage, Unternehmen und Urheber, entdeckt zu werden. Google behauptet, dass Klicks auf Links in den KI-Antworten qualitativ hochwertiger für die Webseiten seien. Neu sind auch im Fließtext integrierte Links. Verlage und Inhalteersteller sorgen sich hingegen um wegbrechende Werbeeinnahmen durch weniger Klicks auf ihre Seiten.

In der Testumgebung Search Labs gibt es zudem neue Funktionen wie das Speichern von AI Overviews für später und eine Option zur Vereinfachung des Antworttexts, um Einsteigern in einem Thema zu helfen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Das KI-Startup Cosine hat mit Genie ein neues Modell zur UnterstĂĽtzung von Softwareentwicklerinnen und Entwicklern vorgestellt. Genie ist eine in Zusammenarbeit mit OpenAI nachtrainierte Variante von GPT-4o, die im besonders schweren Programmier-Benchmark SWE-Bench eine Rekordpunktzahl von 30 Prozent erreichte - deutlich mehr als Konkurrenten von Amazon oder Devin von Cognition. Die Lagen bei 19 Prozent. Der SchlĂĽssel zum Erfolg war laut Cosine die Nachahmung menschlichen Denkens.

Genie wurde mit einem proprietären Verfahren trainiert, bei dem eine nicht öffentliche GPT-4o-Variante mit Milliarden von Token hochwertiger, von erfahrenen Entwickler:innen kuratierter Daten aus verschiedenen Programmiersprachen feinabgestimmt wurde. Ein selbstverbesserndes Training mit synthetischen Daten half dem Modell anschließend, mit eigenen Fehlern umzugehen. Cosine plant, sein Portfolio auf spezialisierte und allgemeinere Modelle zu erweitern sowie die Fähigkeiten von Genie basierend auf Kundenfeedback auszubauen. Nicht nur Programmierer:innen sollen von dem Konzept profitieren: "Wir glauben fest daran, dass wir in der Lage sind, das menschliche Denken für jeden Beruf und jede Branche zu kodifizieren. Software ist nur der intuitivste Ausgangspunkt, und wir können es kaum erwarten, euch zu zeigen, woran wir sonst noch arbeiten", schreibt das Unternehmen.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Nous Research hat mit Hermes 3 das erste feinabgestimmte Modell von Metas Llama 3.1 405B veröffentlicht. Doch es hat noch ein Alleinstellungsmerkmal.

Die Hermes-3-Modelle in den Größen von 8, 70 und 405 Milliarden Parametern wurden vom Team nicht nur mit einer Reihe von exotischeren Daten wie Rollenspiel-Texten trainiert – das Team hat das Modell auch „unlocked", also die Sicherheitsmechanismen ausgeschaltet. Damit unterscheidet es sich von proprietären kommerziellen Modellen, die immer wieder aus moralischen Gründen Nutzer-Anfragen verweigern.

Für Hermes 3 gebe es kein "latentes Gedankenverbrechen", heißt technischen Bericht. Die Modelle sollen stattdessen Anweisungen genau befolgen und sich an vorgegebene Weltsichten anpassen. Dadurch ist das Modell grundsätzlich erst einmal neutral und verkörpert auf Wunsch auch problemlos Personen wie Donald Trump. Solche unzensierten Modelle gab es natürlich schon vorher, aber Hermes 3 erzielt in Benchmarks Spitzenwerte unter den Open-Source-Modellen – und schlägt in einigen Benchmarks sogar das zugrundeliegende Llama 3.1.-Modell. Alle Modelle sind auf Hugging Face verfügbar.

Midjourney hat einen neuen Web-Editor veröffentlicht, der die Funktionen "Reframe", "Repaint", "Vary Region", "Pan" und "Zoom" in einer einheitlichen Oberfläche kombiniert. Das vereinfacht die Nachbearbeitung generierter Bilder erheblich. Bislang mussten Nutzende dafür zwischen verschiedenen Befehlen und Oberflächen wechseln.

Parallel dazu öffnet Midjourney seine Plattform für einen breiteren Nutzerkreis: Ab sofort können alle Nutzenden, die mindestens zehn Bilder auf Midjourney erstellt haben, auch auf der Webseite des Unternehmens kreativ werden. Bisher war die Nutzung hauptsächlich auf den Discord-Server beschränkt. Eine vorherige Discord-Installation und -Nutzung wird aber noch immer vorausgesetzt. Ende Juli erschien zudem Midjourney Version 6.1 mit kohärenteren, detaillierteren und visuell ansprechenderen Ergebnissen. Die Bildgenerierung ist 25 Prozent schneller und besonders menschliche Extremitäten, Pflanzen, Tiere sowie kleine Details wurden optimiert. Ein weiteres Modell-Update ist für Ende August geplant.

Die KI-gestützte Bildbearbeitungssoftware Luminar Neo von Skylum erhält neue Funktionen. Mit Hilfe von künstlicher Intelligenz optimieren die Werkzeuge die Farbgebung oder tauschen den Himmel aus. Auch die generative KI Stable Diffusion kommt für Retusche und Bildleinwanderweiterung zum Einsatz.

Ein Schwerpunkt des Herbst-Updates liegt auf Verbesserungen der Fotobibliothek. Eine intelligente Suche ermöglicht das Auffinden von Fotos anhand ihres Inhalts wie Objekte, ähnlich wie bei Google, Apple und Adobe. Luminar Neo bietet zudem neue Filteroptionen nach Kameramodell, Brennweite und weiteren Parametern.

Weitere Neuerungen sind die Übertragung des Farbstils von Referenzbildern auf eigene Fotos sowie eine farbbasierte Maskierung für die selektive Bildbearbeitung. Das Update erscheint im Oktober für Windows und macOS. Die Software ist ab 317 Euro im Jahresabo erhältlich, Abonnenten erhalten das Update kostenlos.

Marktforscher von Gartner prognostizieren, dass bis Ende 2025 mindestens 30 Prozent der Projekte mit generativer KI (GenAI) in Unternehmen eingestellt werden. Gründe dafür könnten schlechte Datenqualität, unzureichende Risikokontrollen, hohe Kosten oder unklarer Geschäftswert sein. Unternehmen tun sich schwer, den Wert von GenAI-Investitionen nachzuweisen und zu realisieren.

Eine Gartner-Umfrage unter rund 800 frühen Anwendern deutet zwar auf Potenziale wie Umsatz- und Produktivitätssteigerungen hin. Die Auswirkungen seien jedoch oft nicht direkt erkennbar. Laut einer anderen Gartner-Prognose könnte der produktive KI-Einsatz im Büro in etwa zwei Jahren erreicht werden. Die Anbieter stehen vor der Herausforderung, ihre massiven Investitionen in KI-Chips und Rechenzentren zu monetarisieren. Analysten der Ratingagentur S&P sehen eine eher zurückhaltende Einführung der Technik in den Unternehmen.

Bislang nutzen erst rund 5,4 Prozent der US-Unternehmen KI. Die Spitzen der Techbranche fordern Geduld und sehen das Risiko einer Unterinvestition als größer an als das einer Überinvestition.

Der bisher weitgehend unbekannte YouTuber David Millette verklagt Nvidia wegen der mutmaßlichen Nutzung seiner Videos als Trainingsdaten für die hauseigene KI. Zuvor hatte er bereits ein ähnliches Verfahren gegen OpenAI angestrengt. Die Klagen stützen sich dabei nicht auf Urheberrechtsverletzungen, sondern auf den Vorwurf unfairer und verbraucherschädigender Geschäftspraktiken.

Laut Klageschrift soll sich Nvidia mit verbotenen Methoden auf Kosten des YouTubers bereichert haben. Dies stellt einen neuen Ansatz dar, wie sich Creator gegen das KI-Training mit ihren Werken wehren. In anderen Fällen ist die rechtliche Zulässigkeit des ungefragten Trainings mit urheberrechtlich geschützten Inhalten noch nicht abschließend geklärt.

Die Klagen erfolgen kurz nach EnthĂĽllungen ĂĽber Nvidias Projekt "Cosmos". Interne Unterlagen und Aussagen ehemaliger Mitarbeiter legen nahe, dass das Unternehmen millionenfach YouTube-Videos als Trainingsmaterial heruntergeladen hat. Dabei sollen Server von Drittanbietern genutzt worden sein, um Nvidias IP-Adressen zu verschleiern. GegenĂĽber Mitarbeitern mit rechtlichen und ethischen Bedenken argumentierte Nvidia unter anderem mit "fair use" der Daten.

(igr)