KI-Update kompakt: YouTube-Training, Apple profitiert, 3D für Fotos

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 5 Min.
Von
  • The Decoder
Inhaltsverzeichnis

Laut einer Untersuchung von Proof News haben mehrere führende Tech- und KI-Unternehmen wie Apple, Nvidia, Anthropic und Salesforce ohne Wissen der Urheber tausende YouTube-Videos zum Training ihrer KI-Modelle genutzt. Der als "YouTube Subtitles" bezeichnete Datensatz enthält Video-Transkripte von über 173.000 Videos von mehr als 48.000 Kanälen, darunter Bildungs- und Medienkanäle sowie bekannte YouTube-Persönlichkeiten.

Der Datensatz ist Teil der von Eleuther AI zusammengestellten Datensammlung "The Pile", die unter anderem von Apple für seine OpenELM-Modelle verwendet wurde. Anthropic und Salesforce haben bereits bestätigt, The Pile für ihre KI-Systeme genutzt zu haben.

Laut YouTube-CEO Neal Mohan ist diese Art der Datennutzung durch die YouTube-Nutzungsbedingungen untersagt. Ob sich die Unternehmen auf das "Fair Use"-Prinzip berufen können, ist noch unklar und wird vermutlich gerichtlich geklärt werden müssen.

Apple ist erneut zum wertvollsten Unternehmen der Welt aufgestiegen. Der iPhone-Hersteller überholte am Dienstag Microsoft und Nvidia an der Börse. Analysten sehen Apples KI-Strategie als Grund für den Kursanstieg.

Die Apple-Aktie schloss bei 234,82 US-Dollar. Das entspricht einer Marktkapitalisierung von 3,6 Billionen Dollar. Microsoft folgt mit 3,34 Billionen Dollar, Nvidia mit 3,1 Billionen.

Die Investmentbank Morgan Stanley wählte Apple zum "Top Pick". Sie erwartet höhere iPhone-Verkäufe durch die KI-Pläne des Unternehmens. Seit Januar stieg Apples Börsenwert um 20 Prozent.

Apple hatte seine KI-Strategie Anfang Juni auf der Entwicklerkonferenz WWDC vorgestellt. Die angekündigten Funktionen sind aber noch nicht verfügbar. Sie sollen im Herbst schrittweise eingeführt werden, zunächst nur auf Englisch und nicht in Europa.

Apples KI-Dienste werden Text- und Bildgenerierung sowie eine verbesserte Siri umfassen. Sie laufen nur auf neueren Geräten wie dem iPhone 15 Pro oder Macs mit M1-Chip.

Google testet aktuell in den Workspace Labs eine neue KI-basierte Anwendung namens Google Vids zur Erstellung von Videopräsentationen. Die App soll Nutzern helfen, schneller zu einem ersten Videoentwurf zu gelangen.

Mit Vids können Multimedia-Präsentationen auf Basis eigener Daten und Vorlagen erstellt werden. Die Anwendung bietet eine Bibliothek mit lizenzfreien Inhalten, ein Aufnahmestudio innerhalb von Workspace sowie die Möglichkeit, Sprecherstimmen oder passende Musik zu generieren. Zudem können bestehende Präsentationsvideos bearbeitet werden.

Vids befindet sich derzeit im Test mit einer ausgewählten Gruppe. In Zukunft sollen weitere KI-basierte Funktionen in Google Workspace eingeführt werden.

Die Anwendung ist nicht zu verwechseln mit Googles Videogenerator Veo, der auf ein fortgeschrittenes Verständnis natürlicher Sprache und visueller Semantik setzt und zusammenhängende Videos von über einer Minute Länge produzieren können soll.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Wissenschaftler der Tschechischen Technischen Universität in Prag und der ETH Zürich haben dafür eine neue Methode namens "WildGaussians" entwickelt. Sie ermöglicht fotorealistische 3D-Rekonstruktionen auch aus unsortierten Fotosammlungen, wie sie beispielsweise Urlauber von Sehenswürdigkeiten im Internet veröffentlichen.

Die neue Methode löst zwei wesentliche Probleme bisheriger Ansätze: Sie kann mit wechselnden Beleuchtungen umgehen - zum Beispiel mit Aufnahmen, die zu verschiedenen Tages- und Nachtzeiten oder bei unterschiedlichen Lichtverhältnissen gemacht wurden. Außerdem erkennt und ignoriert sie Verdeckungen durch bewegte Objekte wie Fußgänger oder Autos, die sich während der Aufnahme im Bild befinden.

In Tests hat WildGaussians die Qualität bisheriger Methoden übertroffen. Gleichzeitig ermöglicht die Technik ein Echtzeit-Rendering mit knapp 120 Bildern pro Sekunde auf einer leistungsfähigen Grafikkarte.

Die Forscher sehen in WildGaussians einen wichtigen Fortschritt für die 3D-Rekonstruktion aus nutzergenerierten Daten aus dem Web.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Zwei Monate nach dem Start auf iOS hat Anthropic nun auch eine Android-App für seinen generativen KI-Assistenten Claude veröffentlicht.

Wie ChatGPT und Gemini kann Claude auf Basis von Text-, Datei- und Bildprompts Antworten generieren. Die App ist kostenlos nutzbar und wird von einem der leistungsfähigsten KI-Modelle, Claude 3.5 Sonnet, angetrieben.

Für eine erweiterte Nutzung und den Zugriff auf zusätzliche Modelle wie Claude 3 Opus ist ein kostenpflichtiges Pro-Abo erforderlich.

Die europäische Weltraumagentur ESA interessiert sich für die KI-gestützte Steuerung von Race-Drohnen der TU Delft. Diese autonomen Drohnen absolvieren einen Testparcours in möglichst kurzer Zeit, wobei sie ihre Position bestimmen und Kollisionen vermeiden müssen.

Die ESA sieht Potenzial, ähnliche neuronale Steuerungssysteme für anspruchsvolle Raumschiffmanöver wie interplanetare Transfers, Landungen oder Andockvorgänge einzusetzen. Das könne effizientere Nutzung von Ressourcen wie Treibstoff und Rechenleistung sowie mehr Autonomie und Robustheit ermöglichen.

Statt eines vorberechneten Kurses soll das Raumschiff dann seine optimale Flugbahn ausgehend von der aktuellen Position selbst bestimmen. Dafür werden sogenannte Guidance & Control Networks genutzt.

Die Forscher wollen diesen Ansatz nun mit Race-Drohnen testen und anschließend einen Demonstrator für eine Weltraummission entwickeln.

(igr)