ICAART 2017: Sarkasmus im Internet stellt Computer vor Probleme

Die KI-Textanalyse versucht sich an Sarkasmus und an der verkürzten Rechtschreibung von Twitter. Fortschritte gibt es durchaus, auch für die Kommunikation während Katastrophen.

47

26.02.2017, 20:03 Uhr

Lesezeit: 4 Min.

Von

Hans-Arthur Marsiske

Die Konferenz ICAART 2017 in Porto war der absolute Wahnsinn und hat mich umgehauen. Ist das ein positives oder negatives Urteil? Die Methode zur Textanalyse, die Shota Suzuki und seine Kollegen von der University of Electro-Communications in Tokyo auf dieser Konferenz vorstellten, würde bei dem Satz wahrscheinlich an ihre Grenzen stoßen: Die japanischen Forscher haben sich vorgenommen, Sarkasmus zu identifizieren, also Stellungnahmen, die anders gemeint sind, als sie zunächst klingen.

Zum einen unterscheiden sie dafür Äußerungen, die sich auf Handlungen oder Situationen beziehen, von solchen, die Emotionen zum Ausdruck bringen. Zum anderen bewerten sie die Äußerungen als positiv oder negativ und gewichten sie gegeneinander. Da in dem fraglichen Satz mit „Wahnsinn“ und „umgehauen“ aber nur negative Einschätzungen vorkommen, würde er von dem vorgeschlagenen Verfahren wohl insgesamt als negatives Urteil eingestuft werden. Ein Anliegen von Suzukis Forschungen ist es, Rezensionen von Kunden im Internet auszuwerten.

Twitter mit Kontextonymen analysieren

Ein womöglich noch ehrgeizigeres Anliegen ist die automatische Analyse von Twitter-Meldungen: Die Beschränkung auf 140 Zeichen hat nicht nur einen sehr „erfindungsreichen“ Umgang mit der Rechtschreibung hervorgebracht, wie Guillaume Gadek betont. Die Aussagen seien häufig auch implizit, ähnlich undeutlich wie beim Sarkasmus. Gadeks Forschungsteam von Airbus DS in Elancourt und der Normandie Université in Rouen schlägt vor, sich an „Kontextonymen“ zu orientieren. Damit sind Worte gemeint, die häufig zusammen verwendet werden und damit auf eine gemeinsame Bedeutung verweisen. Ein Ziel der Twitter-Analyse ist es, die Meinungen und Positionen der Verfasser zu einem Thema zu erkennen.

Gadek und seine Kollegen testeten ihr Verfahren mit den Aufgaben, die beim Wettbewerb SemEval2016 für semantische Analysesysteme gestellt wurden, und waren mit dem Ergebnis recht zufrieden, obwohl sie damit nicht gewonnen hätten. Ähnlich wie bei der Sarkasmus-Detektion stößt ihr Verfahren derzeit noch an Grenzen, wenn mit vermeintlich positiven Äußerungen Position gegen ein Thema bezogen wird. Die Wissenschaftler sind aber zuversichtlich, auch dieses Problem in den Griff bekommen zu können.

Textanalyse kommt voran, aber Skalierung noch unklar

Neben dem kreativen Sprachgebrauch stellt auch die schiere Menge von 500 Millionen Tweets pro Tag eine Herausforderung dar – und zugleich eine Verlockung, verspricht die Analyse der Texte doch eine Vielfalt möglicher Einsichten. Noufa Alnajran, die sich an der Manchester Metropolitan University mit den bisher entwickelten Algorithmen beschäftigt hat, nannte die Identifikation von Gemeinschaften und Ereignissen, das Sammeln von Argumentationen zu bestimmten Themen und natürlich den Zugang zu Kontakten und potenziellen Kunden.

In den Jahren 2011 bis 2016 seien 13 Studien publiziert worden, die sich bei der Auswertung von Twitter-Daten sowohl auf partitionierende, hierarchische, dichtebasierte als auch auf hybride Verfahren der Clusteranalyse stützten. Es seien Fortschritte bei der Analyse der Textnachrichten zu erkennen, allerdings seien die Algorithmen überwiegend mit kleinen Datenmengen getestet worden, während gerade der große Datenumfang die Besonderheit sozialer Medien ausmacht. Inwieweit die Verfahren skalierbar sind, sei noch nicht klar. Redundante Informationen in Gestalt von Retweets stellten ein weiteres Problem dar, da sie ohne angemessene Berücksichtigung zu Verzerrungen führen können.

Nützlich bei Katastrophen, keine Hilfe bei Trump

Es war wohl unvermeidlich, dass in der Diskussion von Alnajrans Vortrag auch der Name des derzeit wohl prominentesten Twitterers fiel. Allerdings besteht wenig Hoffnung, dass automatisierte Analyseverfahren in absehbarer Zeit helfen könnten, einen angemessenen Umgang mit dem amtierenden US-Präsidenten zu finden.

Immerhin können Multiagentensysteme helfen, die besten Fluchtwege zu finden: Shohei Taga (Nippon Institute of Technology) stellte ein System vor, das den direkten Datenaustausch zwischen mobilen Kommunikationsgeräten, ohne den Umweg über eine Basisstation, nutzt, um während Katastrophen aktuelle Informationen zu übermitteln und Navigationshilfen zu geben. Für den Fall, dass dann doch der reale Wahnsinn ausbricht und einen wortwörtlich umzuhauen droht, war das am Ende der — tatsächlich eher nüchternen — Tagung eigentlich eine ganz beruhigende Vision. (jow)

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}