KI-Programm besser als Menschen im Verständnis natürlicher Sprache

Ein KI-Institut des chinesischen Konzerns Alibaba hat eine Premiere erzielt, die zeigt, dass die Maschinenintelligenz auch beim Lesen und Verstehen menschliche Fähigkeiten zu überholen beginnt

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Jetzt scheint es allmählich ans Eingemachte zu gehen. Ein von der chinesischen Alibaba-Gruppe entwickelte KI-Programm konnte erstmals Menschen in der Beantwortung von Fragen und dem Verständnis von Text schlagen. Die chinesische Regierung will das Land führend in der Entwicklung von Künstlicher Intelligenz machen und hat dafür eine nationale Strategie aufgestellt. Dazu ernannte das Ministerium für Wissenschaft und Technik die Internetkonzerne Baidu, Alibaba und Tencent sowie iFlyTek zum ersten nationalen Team für die Entwicklung der KI-Technik der nächsten Generation.

Baidu ist zuständig für die Entwicklung autonomer Fahrzeuge, Alibaba für die Entwicklung von Clouds für "city brains" (Smart Cities sollen sich an ihre Einwohner und ihre Umgebung anpassen), Tencent für die Enwicklung von Computervision für medizinische Anwendungen und iFlyTec für "Stimmenintelligenz". Die vier Konzerne sollen offene Plattformen herstellen, die auch andere Firmen und Start-ups verwenden können. Überdies wird bei Peking für eine Milliarde US-Dollar ein Technologiepark für die Entwicklung von KI gebaut. Dabei geht es selbstverständlich nicht nur um zivile Anwendungen, sondern auch militärische. Noch gibt es in den USA mehr KI-Firmen, aber China liegt bereits an zweiter Stelle. Das Pentagon ist beunruhigt.

Offenbar kommt China rasch vorwärts. Ende 2017 stellte die KI-Firma iFlyTek, die zunächst auf Stimmerkennung und digitale Assistenten spezialisiert war, einen Roboter vor, der den schriftlichen Test der nationalen Medizinprüfung erfolgreich bestanden hatte. Der Roboter war nicht nur mit immensem Wissen aus 53 medizinischen Lehrbüchern, 2 Millionen medizinischen Aufzeichnungen und 400.000 medizinischen Texten und Berichten gefüttert worden, er soll von Medizinexperten klinische Erfahrungen und Falldiagnosen übernommen haben. Eingesetzt werden soll er, in China herrscht vor allem auf dem Land, Ärztemangel, als Helfer, der mit der automatischen Auswertung von Patientendaten eine erste Diagnose erstellt und ansonsten Ärzten mit Vorschlägen zur Seite stehen.

Jetzt also hat Alibabs Data Science Institute ein KI-System auf den Stanford Question Answering Dataset (SQuAD) angesetzt. Dieser enthält mehr als 100.000 Fragen/Antworten in natürlicher Sprache, basierend auf mehr als 500 Wikipedia-Artikeln, um das Leseverständnis zu testen. Das Programm muss die Wikipedia-Artikel lesen und verstehen können, um dann die Fragen richtig zu beantworten.

Das Alibaba-Team hat Anfang Januar den Spitzenplatz erreicht und zunächst das Microsoft-Team geschlagen. Und zudem hat das Programm erstmals auch knapp mit 82,440 die Quote an richtigen Antworten übertroffen, die Menschen mit 82,304 erzielt haben. Allerdings überholte das Microsoft-Programm einen Tag später den Rekord mit einer Quote von 82,650, Alibaba kann allerdings beanspruchen, das erste die Menschen im Leseverständnis ausbootende Programm erstellt zu haben.

Luo Si, der Leitende Wissenschaftler für die Verarbeitung natürlicher Sprache, erklärt, dass nun "objektive Fragen" wie "Was verursacht Regen" mit hoher Genauigkeit von Maschinen beantwortet werden können. Im Grunde müssen nur Sätze verbunden werden, die einmal als Frage und einmal als Antwort vorliegen. Sind die Fragen oder Texte nicht eindeutig genug bzw. grammatikalisch falsch oder gibt es keine vorhandenen richtigen Antworten, wird es schon schwieriger oder unmöglich.

Die Einsatzgebiete sind eingeschränkt, aber vergleichbar mit den Bots und digitalen Assistenten von Google, Amazon oder Microsoft, die auch immer besser Fragen in natürlicher Sprache verstehen können. Nach Luo Si könne man die zugrundeliegende Technik für die Kundenbetreuung, für Museumsführungen oder für die Online-Beantwortung von medizinischen Fragen durch Patienten einsetzen. Klar ist, dass er hervorhebt, dass damit Menschen weiter als bisher ersetzt werden können. Ob damit aber viele Arbeitsplätze auf die Schnelle gefährdet sind, muss abgewartet werden.