Rückblick: Wie ChatGPT die TR-Redaktion bewegte

Von "Wow, das funktioniert" bis ernüchternd: Die Mitglieder der Redaktion von MIT Technology Review halten ihre persönlichen Erfahrungen mit ChatGPT fest.

28

(Bild: CHUAN CHUAN/Shutterstock.com)

28.12.2023, 10:20 Uhr

Lesezeit: 8 Min.

MIT Technology Review

Von

Seit über einem Jahr ist ChatGPT nun in der Welt – und hat diese gehörig durchgerüttelt. Da fühlt es sich für uns als Redaktion von MIT Technology Review genau richtig an, rückblickend zu bewerten, unsere Erwartungen und auch Ernüchterung über das Tools festzuhalten.

Luca Caracciolo, TR-Chefredakteur:

Ich erinnere mich noch gut an den Moment, als wir in der Redaktion zum ersten Mal über ChatGPT sprachen. Ein Kollege war darauf gestoßen und berichtete, wie euphorisch die ersten Nutzer in den sozialen Medien darüber berichteten. Kurze Zeit später haben wir uns näher mit dem Tool beschäftigt.

Da es unser Beruf ist, über die Zukunft zu schreiben, sind Sprachmodelle und insbesondere "GPT" für uns schon lange ein Thema – und wir haben auch schon oft darüber geschrieben. Der schnelle und große Erfolg von ChatGPT hat dann aber auch uns überrascht – vielleicht, weil wir auch ein wenig betriebsblind sind und eher von einer ganz netten "Iteration" von GPT ausgegangen sind.

Aber was OpenAI mit der Veröffentlichung von "ChatGPT" erreicht hat, ist enorm. Sie haben nämlich ihr mächtiges Sprachmodell GPT mit einer Schnittstelle versehen, die Milliarden von Menschen täglich benutzen: Text-Chat. WhatsApp, Signal, iMessage, ... Messenger sind aus der täglichen Kommunikation nicht mehr wegzudenken. Und was liegt da näher, als "einfach" mit einer KI zu chatten? Damit hat OpenAI das für viele noch abstrakte Thema "Künstliche Intelligenz" zugänglich gemacht – und quasi über Nacht einen neuen Markt geschaffen.

Ein paar Monate später, der erste Hype hatte sich gelegt, saß ich neben meinem Sohn. Er hatte ChatGPT auf seinem MacBook laufen und lernte Mathematik – mit der KI. Sie stellte ihm Aufgaben, erklärte ihm die Rechenregeln dahinter und den Rechenweg. Mich braucht er dafür nicht mehr...

Videos by heise

Andrea Hoferichter, TR-Redakteurin für Biotech und Medizin:

Neid war vielleicht das erste Gefühl, als ChatGPT erstmals einen von mir beauftragten Text schrieb – irgendeinen Unsinn à la "Der Mond ist aufgegangen" im Stil von Olaf Scholz. Superflott erschien eine Zeile nach der anderen auf meinem Bildschirm, 4000 Zeichen in nicht mal einer Minute. Da ist mein Schaffensprozess doch deutlich langsamer und auch holpriger. Leider gilt das noch immer, obgleich ich durchaus ab und zu mit dem Sprachbot arbeite. Bei Textzusammenfassungen und Stilkontrollen taugt er immerhin als Hilfswerkzeug. Komplette Aufgaben würde ich ihm aber nicht überlassen, zu erratisch, mitunter auch zu glatt – zumindest für meinen Geschmack – sind die Ergebnisse. Überrascht war ich bei einer Recherche für unsere Sommerausgabe zum Thema Bildung davon, welchen frischen Wind sich Lehrkräfte von ChatGPT und Co. erhoffen. Schule wie im letzten Jahrhundert sei wegen des Schummelpotenzials gar nicht mehr möglich, hieß es. Unterricht werde nun endlich projektorientierter, individueller und anregender. Ob es tatsächlich so kommt, trotz Lehrermangel und schlechter Ausstattung der Schulen, könnte durchaus Stoff für einen Faktencheck im nächsten Jahr sein.

Gregor Honsel, TR-Redakteur für Mobilität und Energie:

Eigentlich neige ich nicht dazu, Chat-Kanäle mit meinen Kommentaren zu fluten. Aber am späten Nachmittag des 17. März musste es einfach sein. Ich hatte ChatGPT4 unter anderem beauftragt, einen Artikel von mir im Stile von Goethe, Shakespeare, James Joyce, Arno Schmidt und der Bildzeitung umzudichten. Die Ergebnisse waren, wie ich damals postete, "unfassbar gut". Und meine Kollegin Jennifer Lepies kommentierte: "OMG – wie witzig ist das denn?"

Das Ganze war natürlich ein streng dienstliches Experiment. Die Ergebnisse sind in Heft 4/2023 von MIT Technology Review zu finden. Hier eine kleine Kostprobe. Input: "Aber was glauben Habeck und seine Leute eigentlich, wo die Menschen hierzulande wohnen?" GoethePT4: "Doch was erdenkt Herr Habeck, sein Gefolg' in seiner Runde, Wo hausen Menschen hier im Land, wo ist ihr Wohnungsgrunde?"

Ich hätte mich noch stundenlang damit beschäftigen können, ChatGPT immer obskurere Aufgaben vorzulegen – Bedienungsanleitungen in Hexametern; Wetterberichte als Haikus; das Grundgesetz auf Mittelhochdeutsch; die Zehn Gebote als Gangsterrap. Die Ergebnisse wären wohl nicht immer brillant, aber stets überraschend und witzig.

Eines wurde mir sehr schnell klar: Auch wenn Großmeister wie Dieter Hildebrandt noch unerreicht bleiben – besser als ich selbst war ChatGPT allemal, zumindest was Parodien betraf. "Ich fühle mich gerade wie Garri Kasparow 1996", habe ich am 17. März in unseren Redaktionskanal gepostet.

Wolfgang Stieler, TR-Redakteur für Physik und Künstliche Intelligenz:

Als ich angefangen habe, mich ernsthaft mit KI zu beschäftigen, hat die KI-Forschung grade ihr 50-jähriges Jubiläum gefeiert. Das war 2006 (ja, so alt bin ich schon). Ganz lange war KI exotischer Kram für Nerds – interessante Konzept und Ideen, aber nichts, was wirklich funktioniert. Als ich ChatGPT zum ersten Mal in Aktion sah, war mein erster, spontaner Gedanke: Wow, jetzt funktioniert das, worauf wir 20 Jahre gewartet haben.

Auch wenn die Sprachmodelle in diesem Jahr beeindruckende Fortschritte erzielt haben, ist Ernüchterung eingekehrt. Es bleibt das Problem der Halluzinationen. Solange das nicht gelöst ist, bleiben Anwendungen wie Recherche, Zusammenfassung und Suche grundsätzlich unzuverlässig. Ob das Problem überhaupt gelöst werden kann, ist zur Zeit noch unklar. Was halbwegs zu funktionieren scheint, ist die Idee, Sprachmodelle auf enge Themengebiete zu spezialisieren. Dann werden sie zuverlässiger – bleiben aber Fachidioten.

Immerhin: Meine Befürchtung, die Technologie werde zur Automatisierung und Skalierung von Hass und Desinformation beitragen, hat sich nicht bestätigt. Aber wahrscheinlich ist das angesichts der Weltlage auch gar nicht notwendig.

Was bleibt? Das "Hamster-im-Laufrad-Gefühl". Immer, wenn Du denkst, jetzt hat sich die Entwicklung ein bisschen beruhigt, bricht irgendwo wieder eine Riesen-Aufregung los: Mal ist es ein neues Modell, interne Machtkämpfe bei einem der großen Player, neue Produkte, der neuste Stand in der Regulierungsdebatte, skandalöse Äußerungen in irgendeinem Interview mit prominenten Forschenden, neue Produkte … Ich verbringe jeden Arbeitstag mindestens eine Stunde damit, die News zu scannen. Nach der Ankündigung von Googles Gemini haben die US-Kollegen geschrieben, die KI-Entwicklung hätte ihren "Peak Hype" erreicht. Das glaube ich nicht. Die KI ist groß und das Internet ist ihr Prophet.

Lesen Sie auch

Front des New York Times Building an der Eighth Avenue in Manhattan.

KI: New York Times verklagt OpenAI und Microsoft wegen Urheberrechtsverletzungen

Young,Female,Teacher,Giving,A,Data,Science,Presentation,In,A

KI-Suche für die Wissenschaft: "ResearchGPT ist eine Art Turbo-Google-Scholar"

"Man glaubte auch, ein Computer könnte niemals in eine Hosentasche passen"

Aylin zur Borg, Social-Media-Managerin für TR:

Als die Redaktion Zugang zu ChatGPT bekam, war ich im Produktivitätsrausch: Wie viel mehr Social-Media-Beiträge ich wohl für die Technology Review schreiben könnte, wenn mir die KI die Hälfte der Arbeit abnimmt! Aber meine Versuche, ChatGPT für mich arbeiten zu lassen, scheiterten. So gut es in einfachen, kreativen Aufgaben oder Zusammenfassungen auch ist, bei etwas anspruchsvolleren Schreibaufgaben zeigten sich die Schwächen.

Dabei gingen mir vor allem drei Dinge auf die Nerven. Erstens: Die KI kann keine Gedanken lesen, also muss ich ihr lang und breit erklären, wie sie die Texte für Social Media zu schreiben hat: Welche Struktur, welche Zeichenlänge, welcher Schreibstil, nicht zu viele Emojis. Mein Standardprompt war irgendwann fast so lang wie ein Artikel.

Zweitens: ChatGPT liebt Formulierungen wie Durchbruch oder Revolution, und selbst mit der Bitte, doch etwas neutraler zu schreiben und gewisse Begriffe nicht zu nutzen, scheine ich der KI die euphorischen Übertreibungen nicht abgewöhnen zu können.

Drittens: Mit dem gleichen Prompt liefert ChatGPT nicht das gleiche Ergebnis. Die vorgegebene Struktur ist jedes Mal dieselbe, und doch werden Teile des Prompts manchmal einfach ignoriert oder anders interpretiert.

So erstaunlich ich diesen scheinbar plötzlichen Qualitätssprung der einst rudimentären Chatbots finde, ich bin trotzdem wesentlich schneller, wenn ich die Arbeit einfach selbst erledige. Vielleicht sollte ich mich darüber freuen.