KI-Update kompakt: Gesichtserkennung, Tech-Ausblick, Strawberry, FiveThirtyNine

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 8 Min.
Von
Inhaltsverzeichnis

Die Bundesregierung verschärft ihre Pläne zur Netzüberwachung. Zusätzlich zur Ankündigung von Ende August, Fotos und Videos aus dem Internet polizeilicher Gesichtserkennung zu unterziehen, sollen jetzt auch Videos und Tonaufnahmen mittels Stimmerkennung gerastert werden. Das geht aus heise online vorliegenden Dokumenten hervor. Die Regierungsparteien haben ihr "Sicherheitspaket" nach der tödlichen Messerattacke in Solingen zweigeteilt, in einen Entwurf zur Novelle des Asylsystems sowie einen zur "Verbesserung der Terrorismusbekämpfung". Beide Papiere, die heise online vorliegen, hat die Exekutive den Ampel-Fraktionen als "Formulierungshilfe" zugeleitet. Digitalpolitisch bedeutend ist der Entwurf für ein neues Kapitel im bereits ständig erweiterten Anti-Terror-Kampf.

Unter anderem wollen die Regierungsparteien die automatisierte Analyse polizeilicher Daten durch das BKA und die Bundespolizei gestützt durch Künstliche Intelligenz erlauben, sowie das Testen und Trainieren von Daten für KI-Anwendungen für Big-Data-Analysen im Stil von Palantir & Co. Dazu dürften die Strafverfolger erstmals die große Menge polizeilicher Datenbanken zusammenführen und durchforsten. Datenschützer und Rechtsexperten warnen seit Jahren, dass damit die Unschuldsvermutung verloren gehe. Das Paket soll voraussichtlich noch in dieser Woche im Bundestag erstmals beraten werden. Die Grünen-Fraktionschefin Katharina Dröge kündigte an, die Entwürfe "sehr ausführlich prüfen" zu wollen, insbesondere "mit Blick auf verfassungsrechtlich und europarechtlich relevante Fragen".

Der von der EU-Kommission in Auftrag gegebene Wettbewerbsbericht des ehemaligen italienischen Regierungschefs Mario Draghi zeichnet ein düsteres Bild der technologischen Wettbewerbsfähigkeit Europas. Insbesondere im Bereich der Schlüsseltechnologien wie Künstliche Intelligenz (KI) und Cloud-Dienste attestiert der Bericht der EU gravierende Defizite und Rückstände gegenüber den USA und China.

Laut Draghi setzen nur 11 Prozent der EU-Unternehmen KI ein, während 73 Prozent der seit 2017 entwickelten KI-Basismodelle aus den USA und 15 Prozent aus China stammen. Auch bei Investitionen in KI-Start-ups und der Verfügbarkeit von Fachkräften hinkt die EU hinterher. Im Cloud-Markt dominieren die US-Hyperscaler Amazon, Microsoft und Google mit einem Anteil von 65 Prozent, während europäische Anbieter nur noch auf unter 16 Prozent kommen.

Der Bericht empfiehlt der EU, einen Kompromiss zwischen strengen Vorschriften wie der Datenschutz-Grundverordnung (DSGVO) und dem geplanten AI Act einerseits und Anreizen für Investitionen und Innovationen andererseits zu finden. Nur so könne Europa seine Wettbewerbsfähigkeit in Schlüsselbranchen wahren und eine völlige Abhängigkeit von ausländischer Technologie vermeiden. Draghi warnt, dass der EU ansonsten nur noch Nischenmärkte bleiben.

Unternehmen, die Künstliche Intelligenz in ihre Prozesse integrieren, müssten lernen, die Kosten zu managen und die Produktivitätssteigerung, die die Technik ermögliche, auch einzufangen. Das sagte die VP-Analystin Mary Mesaglio der Unternehmensberatung Gartner Consultants in der Eröffnungs-Keynote zum Start des diesjährigen Gartner IT Symposiums in Australien. Geld für generative KI zu verschwenden, sei einfach, warnte Mesaglio. Sie halte Fehleinschätzungen von 500 bis 1000 Prozent für möglich. Ein Grund dafür seien Preiserhöhungen der Anbieter, ein anderer, dass Menschen, die mit KI experimentieren, die dabei anfallenden Kosten für die Cloud-Nutzung außer Acht ließen.

Auch, dass Mitarbeitende KI für Aufgaben einsetzten, die durch eine einfache Websuche zu bewerkstelligen wären, oder Experimente mit langen und komplexen Anfragen starteten, könne die Kosten in die Höhe treiben. Bei Anbietern, die per Token abrechnen, sei das teurer. Ob der Produktivitätsvorsprung von im Durchschnitt 43 Minuten eingesparter Arbeitszeit pro Tag pro Person, den generative KI laut einer Erhebung der Unternehmensberatung bringen soll, diesen schwer vorhersehbaren finanziellen Einsatz wert ist, scheint derzeit ohnehin noch unklar. Derweil scheinen die Betreiber der Modelle ebenfalls Schwierigkeiten zu haben, mit generativer KI Gewinn zu machen. ChatGPT-Anbieter OpenAI droht Berichten zufolge ein Minusgeschäft von mehreren Milliarden. Nvidia, der Hauptlieferant für KI-Beschleuniger, verzeichnet hingegen Rekordgewinne.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft hat eine neue Methode namens "dynamische Few-Shot-Prompts" vorgestellt. Dabei werden die Beispiele für das Prompting nicht direkt im Prompt angegeben, sondern in einem Vector Store gespeichert. Für jeden User-Input werden dann die relevantesten Beispiele abgerufen und in den Prompt eingefügt: Statt also das Modell mit zu vielen, möglicherweise irrelevanten Beispielen zu überfordern, werden so intelligent nur die Top-3-Beispiele ausgewählt, die für den jeweiligen User-Input am relevantesten sind.

Die Architektur besteht aus drei Komponenten: einem Vector Store zur Speicherung der Beispiel-Prompts, einem Embedding Model zur Transformation des User-Inputs in einen Vektor und einem KI-Modell für die Chat-Vervollständigung. Die Methode soll Genauigkeit, Relevanz und Kosteneffizienz verbessern, während sie flexibel und skalierbar bleibt. Eine Kombination mit Many-Shot-Prompting, das hunderte oder tausende Beispiele nutzt, könnte zu noch leistungsfähigeren KI-Systemen für spezifische Aufgaben führen.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

OpenAI soll laut dem Branchenmagazin "The Information" sein neues KI-Modell "Strawberry" bereits in den kommenden zwei Wochen als Teil von ChatGPT veröffentlichen. Damit würde der Start früher erfolgen als ursprünglich geplant.

Das Hauptmerkmal von Strawberry ist seine Fähigkeit, vor der Beantwortung einer Anfrage 10 bis 20 Sekunden lang "nachzudenken", anstatt sofort zu antworten. Durch diese Denkphase soll das Modell in der Lage sein, komplexe Probleme in Bereichen wie Konzeption, Mathematik und Programmierung zu lösen, die es noch nie zuvor gesehen hat.

Strawberry nutzt angeblich eine spezialisierte Form des "Post-Trainings", um vortrainierte Modelle an bestimmte Aufgaben anzupassen. Kunden sollen so zusätzliche Aufforderungen oder Hacks vermeiden können, die bisher nötig waren, um von ChatGPT intelligentere Ergebnisse zu erhalten. Obwohl Strawberry Teil von ChatGPT sein wird, ist es laut The Information als eigenständiges Angebot mit einigen Unterschieden konzipiert. So wird die erste Version nur Text verarbeiten können, aber keine Bilder. Auch die Preisgestaltung könnte sich von ChatGPT unterscheiden und Ratenbegrenzungen beinhalten. Für schnellere Antworten könnte es ein höherpreisiges Abonnement geben.

OpenAI plant, Strawberry unter anderem für die Unterstützung von Software- und KI-Entwicklern sowie für die autonome Internetsuche mit vorausschauender Planung und tiefgehender Recherche einzusetzen. Allerdings scheint es noch einige Kinderkrankheiten zu geben: So neigt das Modell manchmal dazu, selbst bei einfachen Fragen zu lange zu überlegen. Erste Tester bemängelten, dass Strawberrys leicht bessere Antworten im Vergleich zu GPT-4o die zusätzliche Wartezeit von 10 bis 20 Sekunden nicht wert seien.

Das "Center of AI Safety" hat mit FiveThirtyNine ein KI-System entwickelt, das bessere Vorhersagen treffen soll als menschliche Experten. Es basiert auf GPT-4o und gibt Wahrscheinlichkeiten für benutzerdefinierte Abfragen aus. In einem Test auf der Prognoseplattform Metaculus übertraf FiveThirtyNine mit einer Genauigkeit von 87,7 Prozent eine Gruppe von menschlichen Experten mit ihren 87,0 Prozent.

Die Entwickelnden sehen vielfältige Einsatzmöglichkeiten, etwa zur Unterstützung von Entscheidungsträgerinnen und Entscheidungsträgern oder zur Risikoeinschätzung in Chatbots. Allerdings hat das System auch noch Schwächen, wie fehlende Spezialisierung auf bestimmte Anwendungsfälle, Beschränkung auf Informationen aus dem Trainingsmaterial und schlechte Leistung bei sehr kurzfristigen oder aktuellen Ereignissen.

James Earl Jones lieh Darth Vader seine Stimme – und machte den Sith-Lord zu einer Ikone. Der legendäre Schauspieler starb am Montag im Alter von 93 Jahren. Doch seine Stimme soll ewig leben. Bereits 2022 hatte Jones die Rechte an dieser Stimme an Lucasfilm abgetreten.

Dank Künstlicher Intelligenz kann das Filmstudio die Figur des Darth Vader nun weiter mit Jones' ikonischer Stimme einsetzen. Ein KI-Start-up nutzt alte und jüngere Aufnahmen von Jones, um die Stimme zu klonen. Mit derselben Technik wurde auch die Stimme von Mark Hamill verjüngt, damit sie besser zum Auftritt des jungen Luke Skywalker in "The Mandalorian" passt.

(igr)