KI für Themen und Stimmungen: Natürliche Sprache ganz nach Bedarf

Uber AI arbeitet an neuartigen statistischen Modellen, die Texte nach Themenvorgabe erstellen können.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Natürliche Sprache ganz nach Bedarf

(Bild: Ms. Tech)

Lesezeit: 2 Min.

Algorithmen, mit denen realistisch klingende Texte erzeugt werden können, sind längst verfügbar – beispielsweise das OpenAI-Produkt GPT-2. Allerdings ist es bislang noch nicht möglich, konkrete Kategorien vorzugeben – oder die emotionale Ausrichtung des Outputs.

Wissenschaftler in der KI-Forschungsabteilung des Ridesharing-Anbieters Uber, Uber AI, haben nun eine Methode entwickelt, die es Nutzern erleichtern soll, ein bestimmtes Thema oder sogar eine Stimmung vorzugeben, die die generierten Sätze haben, berichtet Technology Review in seiner Online-Ausgabe ("KI lernt besser texten").

Obwohl das Modell immer noch kein Verständnis für die Satzbedeutung hat, liefert die Technik den Nutzern mehr Kontrolle. Absehbar ist, dass sich damit KI-generierte Sprache für domänenspezifische Anwendungen schaffen lässt – beispielsweise für Chatbots im Bereich Gesundheit oder Finanzbranche. Gleichzeitig könnte man die Modelle von der Generierung problematischer Inhalte wegführen.

Bei der Umsetzung werden zwei unterschiedliche statistische Modelle eingesetzt. Das erste ist einfach das originale Sprachmodell, etwa GPT-2, das die Sätze anhand von Wahrscheinlichkeiten konstruiert, ob bestimmte Worte in den Texten hintereinander erscheinen. Das zweite Modell prüft dann, ob der Output des ersten Modells die gewünschten Attribute aufweist – etwa ob es sich an das vorgegebene Thema oder die vorgegebene Satzstimmung hält. Wenn das gewünschte Thema "Weltraum" ist, wird dann beispielsweise überprüft, wie viele relevante Worte der Output enthält – beispielsweise "Planet", "Galaxie" oder "Orbit". Wenn die Stimmung "positiv" sein soll, könnte das Evaluierungsmodell trainiert werden, den emotionalen Inhalt der ausgegebenen Worte zu checken.

Mehr dazu bei Technology Review Online:

(bsc)