KI-Update kompakt: Perplexity AI, KI-Fakes, Amazon Nova, Jobmarkt
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel GrĂĽnewald
- The Decoder
Perplexity AI verspricht Hardware – für unter 50 US-Dollar
Aravind Srinivas, CEO der KI-Suchmaschine Perplexity AI, hat angekündigt, ein reines KI-Audio-Gerät für unter 50 US-Dollar entwickeln zu wollen. Mittels gesprochener Sprache soll man das Gerät Fragen stellen können und es soll mit Sprache antworten. Srinivas bezeichnet Perplexity nicht als Suchmaschine, sondern als eine Antwortmaschine.
Bei X schrieb er, wenn sein Beitrag mehr als 5000 Likes bekommt, werde er das Gerät definitiv entwickeln. Mehr als 5000 Menschen verteilten Herzen dafür. Wann das Gerät erscheint, wie weit die Entwicklungen sind oder ob es doch mehr als Sprechen können soll, ist noch unklar.
Derzeit kündigen viele große KI-Anbieter an, in den Hardware-Markt für Verbraucherprodukte einsteigen zu wollen. OpenAI arbeitet mit Ex-Apple-Chefdesigner Jony Ive an einem Gerät. Meta hat bereits eine Brille mit Sprachsteuerung für Meta AI im Angebot. Auch Google arbeitet erneut an einer smarten Brille und Midjourney hat ein Hardware-Entwicklungsteam gegründet.
Einfluss von KI-Fakes auf Wähler ist Anlass zur Sorge
Bei Wahlen in Deutschland könnten aus Sicht des KI-Forschers Gerard de Melo Desinformation und Beeinflussung in sozialen Medien mithilfe von Künstlicher Intelligenz zunehmen. "Die größte Sorge ist, dass Menschen völlig falsche und aus der Luft gegriffene Informationen und Bilder erhalten, die durch KI erzeugt sind", sagte der Forscher am Hasso-Plattner-Institut (HPI) in Potsdam der dpa. Fachleute aus Wissenschaft, Wirtschaft und Politik diskutierten dort bei einer zweitägigen Konferenz über Chancen und Risiken von KI.
Auch das Bundesamt für Verfassungsschutz (BfV) warnt vor möglichen Versuchen der Einflussnahme anderer Staaten auf die anstehende Bundestagswahl. Denn mittels KI können in immer kürzerer Zeit Deepfake-Videos erstellt und Stimmen geklont werden. Ob dies bereits für die Wahl im Februar eine wesentliche Gefahr darstelle, sei laut de Melo noch offen. Der Wissenschaftler geht aber auch davon aus, dass es künftig mehr Überprüfungen und Mechanismen geben werde, um sicherzustellen, "dass man es wirklich mit einem Menschen zu tun hat und um Bots zu entlarven".
Spielesammlung deckt systematische Schwächen von KI-Systemen auf
Ein Forschungsteam hat mit BALROG eine Benchmark-Plattform entwickelt, die groĂźe Sprachmodelle und visuelle Sprachmodelle in verschiedenen Spielumgebungen auf die Probe stellt. Die Testumgebungen reichen von einfachen Aufgaben bis hin zu komplexen Spielen wie dem "NetHack Learning Environment". FĂĽr die Tests wurden fĂĽhrende Open-Source- und kommerzielle Sprachmodelle wie GPT-4o, Claude 3.5 und Llama 3.2 eingesetzt.
Die Ergebnisse zeigen deutliche Grenzen aktueller KI-Sprachmodelle auf: Selbst Spitzenreiter wie GPT-4o von OpenAI erreichten im Durchschnitt nur 32 Prozent der möglichen Punktzahl. Bei komplexen Spielen, die langfristige Planung erfordern, scheiterten alle Modelle fast vollständig. Das Team sieht in den Ergebnissen einen wichtigen Beitrag, um die Fähigkeiten und Grenzen aktueller KI-Systeme besser zu verstehen. Insbesondere die Schwierigkeiten bei der bildbasierten Entscheidungsfindung zeigten dringenden Verbesserungsbedarf auf. Zudem müsse die Fähigkeit der Modelle verbessert werden, abstraktes Wissen auf konkrete Situationen anzuwenden.
Intellivision-Werbung soll nicht mehr lĂĽgen
Mit Millionen Gesichtern will Intellivision Technologies seine Gesichtserkennung trainiert haben. Die sei jetzt so schlau, dass sie nicht nur eine der höchsten Erkennungsraten habe, sondern auch durch Fotos oder Filme nicht getäuscht werden könne. Und überhaupt sei die Gesichtserkennung im Unterschied zu Konkurrenz gar nicht voreingenommen hinsichtlich Hautfarbe oder Geschlecht. Die US-Handelsbehörde FTC will solche Irreführung jetzt unterbinden. Denn Intellivision Technologies habe keine Nachweise für die Werbebehauptungen erbringen können. Offenbar habe die Werbeabteilung diese Lobpreisungen frei erfunden.
Was die "Millionen Gesichter" anbelangt, handelt es sich laut den Untersuchungsergebnissen um lediglich etwa 100.000. Der Rest waren KI-generierte Abwandlungen der echten Bilder. Um ein ausführliches Gerichtsverfahren zu vermeiden, verpflichtet sich Intellivision dazu, nicht länger irreführenden Behauptungen zu Genauigkeit, Erkennung unechter Gesichter oder Vergleichen bei der Voreingenommenheit zu verbreiten.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Amazon stellt neue KI-Grundlagenmodelle "Nova" vor
Amazon hat mit der Nova-Familie neue KI-Grundlagenmodelle für die Text-, Bild- und Videoanalyse vorgestellt. Die Modelle sind in Verständnis- und Kreativmodelle unterteilt. Die Modelle sind in Verständnis- und Kreativmodelle unterteilt. Das leistungsfähigste Verständnismodell Nova Pro verarbeitet Text-, Bild- oder Videoeingaben, generiert Textausgaben und kann laut Benchmarks mit der Konkurrenz mithalten.
Es kann bis zu 300.000 Token verarbeiten und komplexe Workflows ausführen, bei denen APIs und externe Tools eingebunden werden. Ein noch leistungsfähigeres Modell namens "Nova Premier" ist für Anfang 2025 angekündigt. Für kreative Anwendungen stellt Amazon Nova Canvas für Bildgenerierung und Nova Reel für Videoproduktion vor. Die Modelle sind zunächst exklusiv über Amazon Web Services in den USA verfügbar.
Tencent stellt Open-Source-Videogenerator HunyuanVideo vor
Der chinesische Technologiekonzern Tencent präsentiert mit HunyuanVideo ein neues Open-Source-Modell für KI-gestützte Videogenerierung. Mit über 13 Milliarden Parametern ist es laut Tencent das derzeit größte öffentlich verfügbare Modell seiner Art.
Laut der technischen Dokumentation übertrifft HunyuanVideo bestehende Systeme wie Runway Gen-3 und Luma 1.6 sowie drei führende chinesische Videogenerierungsmodelle, insbesondere bei der Bewegungsqualität. Das Modell mehrere Aufgaben, darunter die Generierung von Videos aus Text, die Umwandlung von Bildern in Videos und die Erstellung von Avatar-Animationen.
Auch die Generierung von Audio zu Videos gehört zum Funktionsumfang. Mit der Veröffentlichung als Open Source auf GitHub will Tencent den Abstand zwischen geschlossenen und offenen Systemen überbrücken und plant dafür eine kontinuierliche Weiterentwicklung.
Open-Source-Tool Nextcloud Talk mit neuen KI-Funktionen
Die Kollaborations- und Videokonferenzsoftware Nextcloud Talk hat mit dem Paris getauften Release ein umfangreiches Update erhalten. Sie verfügt nun über einen Desktop-Client, der für Windows, macOS und Linux erhältlich ist. Weitere Neuerungen umfassen einen erweiterten Funktionsumfang für Videokonferenzen und Webinare sowie einen KI-Assistenten für Chats und Meetings.
Aus aufgezeichneten Videokonferenzen lässt sich mit ihm automatisch ein Transkript erstellen und dieses zu einem Protokoll zusammenfassen. Auch Nachrichten im Chat kann die KI zusammenfassen. So sollen Nutzerinnen und Nutzer nach Krankheit oder Urlaub schnell auf den neuesten Stand kommen können, ohne hunderte ungelesene Nachrichten durchforsten zu müssen. Mit dem Update für Talk will Nextcloud eine Open-Source-Alternative zu Microsoft Teams anbieten.
Generative KI verändert bislang sicher geglaubte Jobs
Generative KI hat einen größeren Einfluss auf den Arbeitsmarkt als bisherige Automatisierungsprozesse. Das geht aus einem Bericht der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung (OECD) hervor. Demnach sind vorwiegend Regionen und Bereiche betroffen, in denen der Einsatz von Technik in der Vergangenheit nur wenige Arbeitsplätze automatisiert hat. KI ermöglicht die Automatisierung von kognitiven und kreativen Aufgaben von spezialisierten Arbeitskräften. Laut dem OECD-Bericht wirkt sich der zunehmende Einfluss von generativer KI vor allem auf Berufe im Finanz- und Versicherungswesen, in der Kommunikations-, sowie der Technologiebranche aus.
Weil solche Jobs vorwiegend in urbanen Gebieten und Ballungszentren liegen, verschiebt sich der Einfluss der Automatisierung vom Land in die Stadt. Bislang veränderten Automatisierungsprozesse überwiegend Arbeitsplätze in Produktion und Fertigung sowie Berufe in ländlichen Gebieten, wie Viehhaltung oder Getreideanbau. Während also zum Beispiel in Thüringen nur etwa 40 Prozent der Jobs stark von künstlicher Intelligenz betroffen sein sollen, schätzt die OECD den Anteil für Berlin auf knapp 70 Prozent. Eine insgesamt rückläufige Anzahl von Jobs erwarten die Forscherinnen und Forscher deswegen allerdings nicht.
Das war das KI-Update von heise online vom 4. Dezember 2024. Eine neue Folge gibt es jeden Werktag ab 15 Uhr.
(igr)