KI-Update kompakt: StabilityAI, Midjourney, Axel Springer + OpenAI, ResearchGPT

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 6 Min.
Inhaltsverzeichnis

Noch in diesem Jahr könnte Midjourney v6 erscheinen, OpenAI bekommt für Millionen Zugang zu Inhalten von Axel Springer und Microsoft Copilot bekommt einen Copiloten für Musikkompositionen. Dies und mehr in der heutigen Zusammenfassung.

Stability AI, das Start-up hinter dem Text-Bild-Modell Stable Diffusion, startet einen Abonnement-Service. Ziel ist es, die kommerzielle Nutzung seiner Modelle zu standardisieren und die Finanzierung zukünftiger Forschung und Entwicklung sicherzustellen.

Drei Mitgliedschaftsoptionen stehen zur Verfügung: Non-Commercial (kostenlos, für persönliche Nutzung und Forschung), Professional (20 US-Dollar pro Monat, für Kreative, Entwickler und Start-ups) und Enterprise (individuelle Preise, für größere Unternehmen). Alle Mitglieder erhalten frühzeitigen Zugang zu neuen KI-Modellen, allerdings ist die kommerzielle Nutzung auf die beiden kostenpflichtigen Stufen beschränkt.

Zu den verfügbaren Modellen zählen Stable Diffusion Turbo, SDXL Turbo, Stable Video Diffusion und diverse Sprachmodelle des Unternehmens. Mit den bezahlten Mitgliedschaften möchte Stability AI einen Ausgleich zwischen Wettbewerbsfähigkeit und Open-Source schaffen. In der Vergangenheit gab es Gerüchte über finanzielle Probleme bei dem Unternehmen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Ende November berichtete Fortune, dass Stability AI aufgrund von Investoren-Druck nach Käufern suche und CEO Emad Mostaque zum Rücktritt aufgefordert worden sei, was das Unternehmen jedoch dementierte.

Das große Update Midjourney v6 könnte noch dieses Jahr erscheinen. Wie bei früheren Releases hat das Unternehmen begonnen, Bewertungen für von v6 erstellte Bilder zu sammeln, was auf eine baldige Veröffentlichung hindeutet.

Midjourney verspricht mit der v6-Version kohärentere Bilder, die Verbesserungen im Verständnis der Prompts und im Weltwissen aufweisen. Zahlende Kunden haben die Möglichkeit, Feedback zu den generierten Bildern abzugeben. Die aktuell bereitgestellten Beispielbilder sind aber laut Midjourney nicht unbedingt repräsentativ für das endgültige Produkt.

OpenAI hat eine Partnerschaft mit dem Medienkonzern Axel Springer geschlossen, um Zugang zu dessen Inhalten für ChatGPT und andere GPT-basierte Dienste zu erhalten. Die Financial Times berichtet, dass OpenAI mehrere zehn Millionen Euro für die Nutzung der Artikel von Bild, Welt, Politico und Business Insider bezahlt. Diese Vereinbarung könnte auch dazu dienen, potenziellen rechtlichen Auseinandersetzungen aus dem Weg zu gehen, da OpenAI bisher das ganze Internet für das Training seiner Sprachmodelle genutzt hat. Axel Springer hatte zuvor seine Seiten für den OpenAI-Crawler gesperrt und lässt sich nun den Zugang bezahlen.

OpenAI hat auch einen ähnlichen Vertrag mit der Nachrichtenagentur AP abgeschlossen, wobei der finanzielle Umfang unbekannt ist. Das könnte darauf hindeuten, dass OpenAI in Zukunft viele solcher Verträge abschließen muss. Das würde allerdings auch die Finanzierung von ChatGPT und anderen OpenAI-Diensten belasten, da die Einnahmen aus kostenpflichtigen Abonnements für solche Deals kaum ausreichen dürften. Vorläufig bleiben Investoren wie Microsoft als Finanzierungsquelle.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Meta hat drei innovative Forschungsprojekte seines Fundamental AI Research Teams vorgestellt: Ego-Exo4D, Seamless Communication und Audiobox.

Ego-Exo4D ist ein Datensatz und Benchmark-Set zur Unterstützung der KI-Forschung in den Bereichen Video-Lernen und multimodale Wahrnehmung. Das Projekt fokussiert sich auf komplexe menschliche Aktivitäten wie Sport, Musik, Kochen, Tanzen oder Fahrradreparaturen. Meta sieht mögliche Anwendungen von Ego-Exo4D in Augmented-Reality-Systemen, bei denen eine Person durch einen virtuellen KI-Trainer und Anleitungsvideos schneller neue Fähigkeiten erlernen kann.

Seamless Communication ist ein Meta-Projekt, das mithilfe mehrerer KI-Forschungsmodelle eine natürlichere und authentischere Kommunikation über Sprachgrenzen hinweg ermöglicht.

Schließlich präsentiert Meta mit Audiobox ein neues Modell zur Generierung von Audio, das Stimmen und Soundeffekte durch eine Kombination von Spracheingabe und natürlichsprachlichen Textprompts erzeugen kann. Das soll die Erstellung von benutzerdefinierten Audiodateien für verschiedene Anwendungsfälle erleichtern.

Das Start-up Consensus hat ResearchGPT entwickelt, ein KI-System, das ChatGPT mit einer Datenbank aus 200 Millionen Forschungsarbeiten über eine Such-API verbindet. ResearchGPT zitiert wissenschaftliche Studien in seinen Antworten, indem es die Eingabe in eine Forschungsanfrage umwandelt und maschinenlesbare Inhalte samt extrahierten Metadaten aus den Studien zurückgibt. Das Unternehmen setzt auf ein Freemium-Modell, bei dem ein Großteil der Funktionen kostenlos ist, während rechenintensive Funktionen hinter einer Paywall liegen.

Durch die Verbindung des Chatbots mit der Suchmaschine kann ResearchGPT Zitate aus gefundenen Studien verwenden, um seine Aussagen zu untermauern. Es analysiert die 20 wichtigsten Arbeiten, die von der Suchmaschine geliefert werden und stellt verschiedene Argumente und Sichtweisen zu einem Sachverhalt dar, falls diese in verschiedenen Artikeln vorhanden sind. Die Suchmaschine verwendet eine benutzerdefinierte hybride Suchmethode, die die Suche nach Schlüsselbegriffen mit der Vector Embedding Similarity kombiniert.

ResearchGPT ist jedoch nur so gut wie die Studien, die von der Suchmaschine zurückgegeben werden, und kann keine Fragen beantworten, die nichts mit wissenschaftlicher Forschung zu tun haben. Das Start-up strebt an, ResearchGPT im Laufe der Zeit weiterzuentwickeln, um Menschen bei der Konsensfindung zu unterstützen.

Microsoft arbeitet mit dem KI-Musik-Start-up Suno zusammen, um dessen KI-Modell in Microsoft Copilot einzubinden. Suno kann basierend auf einer Beschreibung eines Musikstils passende Lieder komponieren und ermöglicht das Hinzufügen von Songtexten über einen Chat.

Ende November präsentierte Suno die zweite Version seines Modells, Chirp, mit verbesserter Audioqualität, längeren Songs, schnellerer Generierungsgeschwindigkeit und besserer Unterstützung für mehrere Sprachen. Um Musik mit Microsoft Copilot und Suno zu kreieren, müssen die Nutzer das Suno-Plugin aktivieren oder auf das Suno-Logo klicken und dann den Chatbot auffordern, einen Song zu erstellen.

(igr)