KI-Update Deep-Dive: Zoom und die KI-Fähigkeit zur Übersetzung

Sebastian Stüker, Director Research Science bei Zoom in Deutschland, spricht im Podcast über die Integration von KI ins Arbeitsumfeld und Simultanübersetzungen.

vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 5 Min.
Inhaltsverzeichnis

Zoom, der bekannte Anbieter von Videokonferenzsoftware, hat sich schon längst zu einem umfassenden Kommunikations- und Kollaborations-Tool entwickelt. Dabei spielt künstliche Intelligenz (KI) eine immer größere Rolle. Sebastian Stüker, Director Research Science bei Zoom, gibt Einblicke in die Integration von KI und die Möglichkeiten, die sich daraus für die Arbeitswelt ergeben. Stüker sitzt in Deutschland.

"Die meiste Zeit meines Berufslebens habe ich an der Universität verbracht", sagt Stüker. In seiner klassischen Forscherlaufbahn hat er sich immer mit der automatischen Spracherkennung beschäftigt, dem maschinellen Lernen und der Sprachübersetzung. Er und sein Doktorvater Alex Weibel gründeten ein Start-up, das sich mit simultaner Sprachübersetzung beschäftigte. Die Kunden nutzten die Technik vor allem für Live-Events. Mit der Pandemie und dem Lockdown jedoch musste man neu denken und sich für virtuelle Events rüsten. Stüker und sein Team schauten sich die verschiedenen Videokonferenzdienste an, Zoom hatte den Vorteil, bereits eine Schnittstelle zu haben, die sie nutzen konnten. Und so kam es, dass Zoom nach vielen Gesprächen nicht nur Kooperationspartner wurde, sondern das Startup akquiriert hat.

Als es mit KI in den 1950er Jahren losging, dachte man noch, es werde nur wenige Jahre dauern, bis maschinelle Übersetzungen so weit seien, dass nie wieder jemand manuell übersetzen müsse. Ein Irrtum, wie sich schnell herausstellte. Und auch mit den anderen Bereichen der Künstlichen Intelligenz ging es nicht so schnell vorwärts, wie man sich zunächst erhoffte.

"Man hat anfangs gedacht, man könnte vieles in Regeln fassen und dann mit Hand geschrieben in Regeln übersetzen. Selbst bei der Spracherkennung hat man gedacht, dass man Regeln schreiben kann, die einem sagen, wenn das Audio so aussieht, dann muss das so gesprochen worden sein." Aber man habe schnell festgestellt, dass viele dieser Regeln Dingen wie Bildern, natürlich-sprachlichem Text, gesprochener Sprache nicht gerecht werden würden. Sie seien sehr viel komplexer und variabler und unvorhersehbarer, als dass man es in Regeln fassen konnte. "Und so ist man dann schon früh dahin gekommen, dass es wohl besser ist, statt manuell das Wissen im Rechner zu kodieren, wenn man die Maschine dazu bringt, zu lernen, wie man diese Aufgaben löst, indem man ihr Trainingsdaten gibt", erklärt Stüker.

Podcast: KI-Update
KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Die neuronalen Netze, die heute für Aufsehen sorgen, hatten bereits in den 80er Jahren eine Hochphase. Doch damals habe es Systeme gegeben, die den neuronalen Netzen überlegen waren, die bessere Ergebnisse geliefert hätten. In der Spracherkennung habe man etwa 25 Jahre lang mit statistischen Modellen gearbeitet.

Doch dann seien zwei wichtige Dinge passiert. Zum einen: "Daten liegen in elektronischer Form vor." Das andere: Man habe festgestellt, dass sich GPUs dazu eignen, neuronale Netze zu trainieren. Rechenleistung und Daten ergeben diesen "perfekten Sturm".

Daraus ergeben sich Tools, die wir heute direkt einsetzen können – etwa der AI Companion in Zoom. Er kann als Pendant zu Microsofts Copilot begriffen werden – Stüker sagt, das sei eben auch "Zeitgeist". Denn auch Zoom ist nicht mehr nur ein Anbieter von Videokonferenzsoftware, Zoom hat mit Workplaces eine ganze Kommunikationssuite, es gibt Zoom-Events, Zoom-Rooms, Zoom-Phone und mehr. "Es geht also nicht mehr nur um die reine Kommunikation, sondern es geht darum, wie sieht modernes Arbeiten aus? Wie sieht modernes Arbeiten auch aus in diesem hybriden Umfeld, das wir seit der Pandemie haben, wo Personen im Homeoffice sind, manche im Büro." Hinzukommt, dass man gemeinsam an Dokumenten arbeitet, asynchron kommuniziert und mehr.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

"Der AI-Companion ist ein Werkzeug, das wie ein persönlicher Assistent meine Arbeit optimal unterstützt, indem er Dinge wahrnimmt, indem er Informationen verknüpft, indem er Dinge kreativ erzeugen kann für mich, indem ich teilweise Sachen schon automatisieren lassen kann mithilfe von sogenannten Workflows. Ich kann mir morgens zusammenfassen lassen, was die Kollegen in den USA und in Asien schon gearbeitet haben und mir sagen lassen, welche Bereiche mich besonders betreffen. Das arbeite ich dann ab."

In der Zukunft, glaubt Stüker, wird jeder eine Art KI-Assistenten haben. Er stellt sich vor, dass dieser dann beim Arzt anrufen kann und dort einen Termin ausmacht. Dazu gehört auch, dass auf der anderen Seite ebenfalls ein KI-Assistent zuständig ist. So müsste niemand mehr in irgendwelchen Warteschleifen hängen.

Wie schnell wir dieses Szenario erreichen, ist unklar. Für die Zukunft der maschinellen Übersetzung glaubt Stüker, wird zunächst mal mehr übersetzt werden als bisher. Ob es bald keine menschlichen Dolmetscher geben werde? Doch. Sie werden da eingesetzt, wo es zu wichtig ist, dass alles korrekt ist. Aber die Art des Arbeitens eines Dolmetschers werde sich ändern. Auch sie bekommen einen Assistenten zur Hand.

(emw)