Diese generative KI verwandelt jede Geschichte in einen Comic

Lore Machine vereint mehrere generative Modelle in einem einfach zu bedienenden Paket. Bisher hat die Konsistenz in den Bildergeschichten noch kleine Macken.

In Pocket speichern vorlesen Druckansicht 23 Kommentare lesen
Comic: Katze sitzt am Frühstückstisch

(Bild: Lore Machine / Will Douglas Heaven)

Lesezeit: 6 Min.
Von
  • Will Douglas Heaven
Inhaltsverzeichnis

Vor dreizehn Jahren schrieb ich als Aufgabe für einen Journalismuskurs eine quatschige Kurzgeschichte über einen Mann, der Luxus-Katzenfutter isst. Jetzt sitze ich hier und sehe dabei zu, wie eine generative KI namens Lore Machine meine Worte zum Leben erweckt.

"Wir identifizieren Szenen, Schauplätze und Charaktere sowie die Stimmung. Dieser Vorgang kann bis zu zwei Minuten dauern", heißt es auf der Website von Lore Machine. Die KI des Unternehmens analysiert den Text, extrahiert Beschreibungen der erwähnten Figuren und Schauplätze und übergibt diese Informationen dann an ein Bilderzeugungsmodell, das am Ende eine Art illustriertes Storyboard ausspuckt.

Nach mehr als einem Jahr Entwicklungszeit ist Lore Machine nun zum ersten Mal für die Öffentlichkeit zugänglich. Für 10 US-Dollar pro Monat können Nutzerinnen und Nutzer bis zu 100.000 Wörter Text hochladen (bis zu 30.000 Wörter auf einmal) und daraus 80 Bilder für Kurzgeschichten, Skripte oder Podcast-Transkripte generieren. Power-User erhalten im Enterprise-Paket für 160 US-Dollar pro Monat 2,24 Millionen Wörter und 1.792 Bilder. Die Illustrationen können in verschiedenen Stilen generiert werden, von Manga über Aquarell bis hin zu Achtziger-Jahre-Fernsehserien.

Zac Ryder, Gründer der Kreativagentur Modern Arts, nutzt eine Vorabversion des Tools, seit der Gründer von Lore Machine, Thobey Campion, ihm das Tool vorgestellt hatte. Ryder schickte ihm ein Drehbuch für einen Kurzfilm, und Campion verwandelte es mit Lore Machine über Nacht in eine 16-seitige Graphic Novel.

"Ich weiß noch, als Thobey seinen Bildschirm teilte. Wir waren alle völlig überwältigt", sagt Ryder. "Es war nicht so sehr der Aspekt der Bilderzeugung. Es war das Niveau der Erzählung. Vom Erzählfluss bis hin zu den Emotionen der Charaktere – es hat auf Anhieb gepasst." Seine Agentur verwende Lore Machine nun, um ein fiktives Universum für eine Manga-Serie zu entwickeln, die auf einem Text des Schöpfers der Netflix-Serie "Love, Death & Robots" basiert.

Lore Machine nutzt bekannte Techniken der generativen künstlichen Intelligenz. Ein Sprachmodell scannt den Text und identifiziert Beschreibungen von Personen und Orten sowie die allgemeine Stimmung des Textes. Eine Version von Stable Diffusion erzeugt anschließend die Bilder, und das alles innerhalb weniger Klicks. Damit gehört es zu einer ganzen Reihe benutzerfreundlicher Tools, die die verblüffende Leistung generativer Modelle hinter einer simplen Weboberfläche verbergen.

"Für Nutzer ist eine Menge Arbeit, sich über neue KI-Tools auf dem Laufenden zu halten, und die Benutzeroberfläche und der Arbeitsablauf sind immer anders", sagt Ben Palmer, CEO der Produktionsfirma New Computer Corporation. "Die Verwendung eines Tools mit einer einheitlichen Benutzeroberfläche ist sehr überzeugend. Ich habe das Gefühl, dass die Branche genau hier landen wird."

(Bild: Lore Machine / Will Douglas Heaven)

Thobey Campion gründete das Unternehmen hinter Lore Machine vor zwei Jahren, um an einer Blockchain-Version von Wikipedia zu arbeiten. Als er jedoch sah, wie gut die generativen Modelle bei den Menschen ankamen, wechselte er die Richtung. Campion nutzte das frei verfügbare Text-Bild-Modell Midjourney, um eine Comic-Version von Samuel Taylor Coleridges "The Rime of the Ancient Mariner" zu erstellen. Das Projekt habe sich zwar viral verbreitet, aber Spaß habe es nicht gemacht.

"Meine Frau hat das Projekt gehasst", sagt er. "Ich war jede Nacht bis vier Uhr morgens auf den Beinen und habe versucht, die Bilder richtig hinzubekommen. Das Problem war, dass Text-zu-Bild-Modelle wie Midjourney die Bilder einzeln generieren. Das macht es schwer, die Konsistenz zwischen verschiedenen Bildern derselben Figuren zu wahren. Selbst die Festlegung eines bestimmten Stils für mehrere Bilder kann schwierig sein."