KI-Update kompakt: Video-KI Sora, OpenGPT-X, Anthropic, KI-Ampel

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 9 Min.
Von
Inhaltsverzeichnis

Eine Gruppe von Early-Access-Testern des KI-Videomodells Sora von OpenAI hat aus Protest gegen unbezahlte Entwicklungsarbeit und Ausnutzung für PR-Zwecke einen offenen Brief verfasst und das Tool öffentlich zugänglich gemacht. Die Künstler kritisieren, dass sie kostenlos Fehler suchen, Feedback geben und experimentieren, während OpenAI den PR- und Marketingwert abschöpft. Als Gegenleistung bietet das Unternehmen lediglich einen Wettbewerb an, bei dem ausgewählte Filme gezeigt werden.

Die Gruppe fordert von OpenAI mehr Transparenz und Unterstützung für Künstler über PR-Aktionen hinaus. Als Alternative verweisen sie auf Open-Source-Videotools, die ein freies Experimentieren ermöglichen. OpenAI weist die Anschuldigungen der Künstlergruppe zurück. Laut dem Unternehmen war die Teilnahme freiwillig und ohne Verpflichtungen. Die einzige Bedingung bestand darin, das Tool verantwortungsvoll zu nutzen und keine vertraulichen Details preiszugeben. OpenAI betont, die Künstler weiterhin mit kostenlosen Zugängen, Stipendien und Veranstaltungen zu unterstützen.

Das europäische Forschungsprojekt OpenGPT-X hat ein großes Sprachmodell für KI-Anwendungen veröffentlicht. Das Modell mit dem Namen "Teuken-7B" wurde auf der Plattform "Hugging Face" zum Herunterladen bereitgestellt. Bislang stammen fast alle relevanten KI-Sprachmodelle der westlichen Welt aus den USA. OpenGPT-X hingegen ist ein europäisches Forschungs- und Entwicklungsprojekt, das Anfang 2022 gestartet wurde. Ziel war die Entwicklung eines großen KI-Sprachmodells, das den Anforderungen europäischer Werte, Datenschutzstandards und sprachlicher Vielfalt gerecht wird.

Das Projekt wird von den beiden Fraunhofer-Instituten für Intelligente Analyse- und Informationssysteme (IAIS) und für Integrierte Schaltungen (IIS) geleitet. Beteiligt sind außerdem die TU Dresden, das Forschungszentrum Jülich und Unternehmen wie Aleph Alpha und IONOS SE. "Teuken-7B" wurde von Grund auf mit den 24 Amtssprachen der EU trainiert und umfasst sieben Milliarden Parameter. Es soll nun weltweit frei zur Verfügung stehen und damit eine aus der öffentlichen Forschung stammende Alternative für Wissenschaft und Unternehmen bieten können. Akteure aus Forschung und Unternehmen können das Open-Source-Modell auch in kommerziellen Projekten verwenden und den Code in ihren eigenen Anwendungen der Künstlichen Intelligenz nutzen.

Das KI-Unternehmen Runway hat mit Frames ein neues Basismodell für die Bildgenerierung vorgestellt. Frames zeichnet sich durch eine verbesserte Kontrolle über den visuellen Stil der generierten Bilder sowie eine hohe Detailgenauigkeit aus. Das Modell soll es Nutzern ermöglichen, kohärente visuelle Welten mit spezifischen ästhetischen Merkmalen zu gestalten. Frames könne für Projekte einen einheitlichen Look etablieren und Bildvariationen erzeugen, die diesem Stil treu bleiben. Derzeit führt Runway den Zugang zu Frames schrittweise für ausgewählte Nutzer des im Juni eingeführten Videomodells Gen-3 Alpha ein.

Seit Juli unterstützt das Videomodell die Eingabe eines Startbildes zur Videogenerierung, was häufig benutzt wird, um das Ergebnis zu beeinflussen. Runway präsentiert einige Beispiele für die unterschiedlichen visuellen Stile, die mit Frames erzeugt werden können. Dazu gehören unter anderem fotorealistische Porträts, Kreaturen im Stil handgefertigter Spezialeffekte aus den 80ern, Schallplattencover-Designs und Retro-Anime im Stil der 70er Jahre. Durch die Integration eines hochwertigen Bildgenerators direkt in Runway macht sich das Start-up unabhängiger vom derzeitigen Marktführer Midjourney. Dieser wiederum könnte mit der Veröffentlichung seines geplanten Videomodells Runway stärker Konkurrenz machen.

Anthropics Claude.ai soll neuerdings Schreibstile besser imitieren können. In einer auf X veröffentlichten Demo, sieht es so aus, als ob Claude.ai den Sprachstil der vorgelegten Dokumente analysiert und daraus einen Prompt generiert, der dann bei der Texterstellung verwendet wird. Diese Methode ist wahrscheinlich weniger zuverlässig als das sogenannte Many-Shot-Prompting (also das Prompting mit mehreren Beispielen), aber für die Nutzerinnen und Nutzer zugänglicher.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Anthropic stellt mit dem "Model Context Protocol" (MCP) einen neuen Open-Source-Standard vor, der KI-Chatbots die Interaktion mit externen Datenquellen ermöglicht. Das Protokoll erlaubt sowohl das Auslesen als auch das Einspeisen von Daten. In einer Demonstration wurde gezeigt, wie der Chatbot eine HTML-Seite erstellt und diese direkt in einem Github-Repository speichert.

Das MCP basiert auf zwei Hauptkomponenten: MCP-Server, die Daten bereitstellen und den Zugriff verwalten, sowie MCP-Clients, die auf diese Server zugreifen. Anthropic hat bereits Server für populäre Dienste wie Slack, Google Maps, Fetch, Google Drive und GitHub bereitgestellt. Das Protokoll kann sowohl für lokale als auch für internetbasierte Datenbestände genutzt werden, wobei zunächst nur lokale Server unterstützt werden. Claude-Enterprise-Kunden können bereits ihre internen Systeme über MCP-Server anbinden.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Die noch amtierende US-Regierung unter Präsident Joe Biden lässt Milliarden US-Dollar für die Förderung der Chipfertigung in den USA fließen. Intel meldet, man habe nun Vereinbarungen über insgesamt 7,86 Milliarden US-Dollar aus dem CHIPS Act schließen können. Das Geld wird in die im Bau befindlichen Chip-Fabs in Arizona, New Mexico, Ohio und Oregon investiert. Zusätzlich erhält Intel Steuervergünstigungen in Abhängigkeit von der tatsächlichen Investitionssumme. Unabhängig davon konnte sich Intel bereits im September bis zu 3 Milliarden US-Dollar aus dem CHIPS Act sichern, und zwar für das geheime "Secure Enclave Program" des US-amerikanischen Verteidigungsministeriums. Intel befindet sich zurzeit in schwerem Fahrwasser, macht hohe Verluste, entlässt tausende Menschen und hat bereits Teile vorhandener Chip-Fertigungsanlagen abgeschrieben. Derzeit konzentriert Intel die Investitionen im Wesentlichen auf die USA. Der Bau der geplanten Fabs in Magdeburg sowie des Packaging-Werks in Breslau legte Intel bereits auf Eis. Auch ein Projekt in Israel ruht.

Nutzerinnen und Nutzer des Messengers von Facebook auf dem iPhone können sich über eine Reihe neuer Funktionen freuen, die in den kommenden Wochen per Update auf die Geräte kommen sollen. So wird die Anwendung erstmals Apples Sprachassistentin Siri direkt unterstützen. Dafür bedient sich Meta dabei offenbar Apples SiriKit. So soll es möglich sein, die Sprachassistentin direkt zu bitten, Anrufe per Messenger zu starten beziehungsweise Mitteilungen per Messenger zu versenden. Wichtig ist nur, dass die Messenger-App als Kommunikationsmittel erwähnt wird, wie man dies auch von anderen bei Siri integrierten Anwendungen von Dritten kennt. Damit wird dann auch die Unterstützung für Menschen mit Behinderung verbessert, da sie komplett ohne Griff zum iPhone kommunizieren können. Weiterhin hat Meta sich bei FaceTime inspirieren lassen und die Möglichkeit eingebaut, Nachrichten in Ton- und Filmform bei anderen Personen zu hinterlassen.

Damit werde Facebook Messenger "mehr zu einem voll ausgestatteten Telefonersatz", schreibt Meta. Geht eine Person nicht ran, kann man per Knopfdruck eine Botschaft aufnehmen, die dem Gegenüber dann angezeigt wird. In späteren Versionen, die in den kommenden Wochen erscheinen, soll Facebook Messenger auch personalisierte KI-Hintergründe in Video-Anrufen unterstützen. Diese lassen sich über das Effekte-Icon aufrufen und mittels Meta-KI erzeugen. Meta betreibt neben Facebook Messenger bekanntlich auch WhatsApp. Beide Anwendungen enthalten bereits jetzt KI-Features des Unternehmens.

Die Stadt Hamm zeigte sich im Frühjahr mit ihrer ersten, per Künstlicher Intelligenz gesteuerten Ampel noch größtenteils zufrieden, die seit Juli 2023 an der Kreuzung Heßlerstraße/Marker Allee den Verkehr regelt. Mehrere Kameras sollen Radfahrer und Fußgänger dort frühzeitig erkennen. Das System berechnet dann mithilfe einer KI, wann sie an der Ampel ankommen, um ihnen bevorzugt Grün zu geben. Doch seit ein paar Wochen sorge die automatisierte Schaltung für lange Rückstaus von Autos im Feierabendverkehr und Beschwerden von Fahrern, berichten lokale Medien. Die KI soll daher vorerst von 15:30 bis 17:30 Uhr Pause machen. In diesem Zeitraum wird die Ampel dem neuen Plan der Verwaltung zufolge konventionell geschaltet, heißt es in den Berichten. Ziel sei es, den Autoverkehr in der Rush Hour zügiger abfließen zu lassen. Morgens sei das Problem nicht so groß, bezieht sich der Westfälische Anzeiger auf eine Besprechung der Bezirksvertretung der Stadt. Die Ampel-Staus hätten auch mit mehreren innerstädtischen Baustellen in der Nähe und Ausweichverkehr zu tun, laute eine Vermutung. Würden diese aufgehoben, solle die KI auch nachmittags wieder laufen. Davor wurden aber neue Tests durchgeführt.

Das war das KI-Update von heise online vom 27. November 2024. Eine neue Folge gibt es jeden Werktag ab 15 Uhr.

(igr)