Künstliche Intelligenz: Kampf um das Urheberrecht

Seite 2: Technik als Hilfsmittel

Inhaltsverzeichnis

Links: Selbstporträt Vincent van Gogh, 1889. – Rechts: KI-generiertes Bild zum Prompt "self portrait by Vincent van Gogh, intense colors"

Allerdings können sich menschliche Urheber durchaus technischer Mittel bedienen, wenn sie diese als Hilfsmittel steuernd einsetzen, wie das vielfach bei einem Computer oder einer Kamera der Fall ist. So kann etwa das steuernde Element darin bestehen, dass für ein Foto ein Bildausschnitt gewählt wird, selbst wenn die Aufnahme – wie bei einer Wetterkamera – dann automatisiert erfolgt. Für den urheberrechtlichen Schutz reicht eine menschliche Steuerung bei der Erstellung eines Werkes alleine noch nicht aus, das Werk benötigt auch die erforderliche "Schöpfungshöhe".

Dies bedeutet, dass ein Gestaltungsspielraum bestehen muss und dieser Gestaltungsspielraum in einer Weise genutzt wird, die sich vom rein Handwerklichen und Alltäglichen abhebt. Die Gerichte sind hier durchaus großzügig und lassen schon die sogenannte "kleine Münze" gelten, also Werke von einfacher Qualität, die gerade noch eine individuelle Gestaltung enthalten. Natürlich sind die Grenzen hier fließend und unterschiedliche Gerichte können bei einem vergleichbaren Sachverhalt zu abweichenden Ergebnissen kommen.

Eine solche Schöpfungshöhe ist bei einer Wetterkamera, die automatisiert Bilder aufnimmt, regelmäßig nicht gegeben. Allerdings hat der deutsche Gesetzgeber auch für Lichtbilder ohne die erforderliche Schöpfungshöhe in § 72 Urheberrechtsgesetz (UrhG) ein eigenes Leistungsschutzrecht geschaffen, das dem Urheberrecht sehr ähnlich ist, aber eine kürzere Schutzdauer besitzt. Dies zeigt, dass der Gesetzgeber in der Vergangenheit auf Abgrenzungsprobleme mit neuen Schutzrechten reagiert hat, so beispielsweise bei Fotografien auf das praktische Problem, dass oft nur sehr schwer zu beurteilen ist, ob es sich um ein bloßes Knipsbild handelt oder ob der Fotograf gestalterisch tätig geworden ist. Ob eine solche Ausweitung der Schutzrechte immer sinnvoll ist, kann angesichts des Abmahngeschäfts mit Trivialbildern durchaus infrage gestellt werden.

Im Vereinigten Königreich existiert eine Regelung, die den Schutz KI-generierten Outputs zu erfassen scheint: § 9 Abs. 3 des Copyright, Designs and Patents Act 1988 (CDPA) sieht auch für maschinell erstellte Werke einen Urheberrechtsschutz vor:

Urheberrechtsschutz – auch für maschinell erstellte Werke

§ 9 Abs. 3 des Copyright, Designs and Patents Act 1988 (CDPA)

In the case of a literary, dramatic, musical or artistic work which is computer-generated, the author shall be taken to be the person by whom thearrangements necessary for the creation of the work are undertaken.

In deutscher Übersetzung:

Im Falle eines literarischen, dramatischen, musikalischen oder künstlerischen Werks, das mit Hilfe eines Computers erstellt wurde, gilt als Urheber die Person, die die für die Schaffung des Werks erforderlichen Vorkehrungen getroffen hat.

Allerdings wurde diese Regelung nicht erst im Rahmen der aktuellen KI-Diskussion in den Copyright, Designs and Patents Act eingefügt, sondern existiert schon seit 1988. Offenbar wollte man damit klarstellen, dass auch bei der Verwendung von Computern urheberrechtlich geschützte Werke entstehen können, etwa bei zufallsgesteuerten Sequenzersystemen zur Verwendung mit Synthesizern. Der bislang einzige bekannte Gerichtsfall betrifft auch keine KI-generierten Werke, sondern ein Computerspiel, bei dem wesentliche Gestaltungen von Menschen vorgenommen wurden (konkret geht es um folgenden Rechtsstreit: Nova Productions Ltd v Mazooma Games Ltd & Ors).

Daher verwundert es nicht, wenn die Regelung bei der Anwendung auf aktuelle KI-Modelle Fragen aufwirft, nämlich: Welche Person die "erforderlichen Vorkehrungen getroffen" hat, wenn ein Bild mithilfe eines Modells wie Stable Diffusion erstellt wird. Hier kommen sowohl die Entwickler von Stable Diffusion als auch deren Nutzer in Betracht. Einfacher wird die Rechtslage also auch nicht in Ländern wie dem Vereinigten Königreich, Irland und Neuseeland, die eine solche Regelung besitzen.

Betrachtet man den aktuellen Stand des Urheberrechts und seiner Auslegung in Deutschland, dann werden viele Bilder, die mit Stable Diffusion, DALL-E oder Midjourney erstellt wurden, wohl keinen Urheberrechtsschutz besitzen. Denn der konkrete Output eines Text-to-image Modells lässt sich durch einfache Prompts, also Texteingaben wie zum Beispiel "a photograph of an astronaut riding a horse", nicht so weitgehend steuern, dass er als Ergebnis eines gestalterischen Prozesses eines Menschen angesehen werden kann. Dies zeigt schon der Umstand, dass die Eingabe von Prompts im Regelfall nicht zu einem von einem Menschen planbaren Ergebnis führt, sondern nur zu der Reproduktion eines Stils oder der Wiedergabe von vorgegebenen Bildelementen wie einem Gegenstand, einer Person oder einer Situation. Dabei existieren aber noch erhebliche Varianz und Unvorhersehbarkeit.

Letztlich ist das einer der Gründe, warum das Experimentieren mit diesen Modellen eine so erhebliche Faszination ausübt. Ein bloßer Malstil ist urheberrechtlich nicht schutzfähig, sodass hier keine Handhabe gegen Nachahmer besteht.

Dies bedeutet jedoch nicht, dass Stable Diffusion und Co. nicht auch als Tools eingesetzt werden könnten, bei denen menschliche Kreativität weiterhin eine wesentliche Rolle spielt. Hier kommen mehrere Konstellationen in Betracht.

So können etwa KI-generierte Bilder von einem Menschen in einem Bildbearbeitungsprogramm so modifiziert werden, dass dies zu einem urheberrechtlich geschützten Werk führt – oder ein schon vorbestehendes Foto oder Bild wird mittels KI im Wege des In- oder Outpainting verändert. So wird beim Outpainting ein Bild über den ursprünglichen Rand hinaus fortgesetzt, wie das Beispiel des "Mädchens mit dem Perlenohrring" von Vermeer zeigt, das von dem OpenAI-Mitarbeiter August Kamp mithilfe von DALLE·E ergänzt wurde.

Outpainting von August Kamp für OpenAI/ DALL·E – Original: "Mädchen mit dem Perlenohrring" von Johannes Vermeer diente als Vorlage.

Urheberrechtlich sind die Bilder von Vermeer nicht mehr geschützt, weil seit seinem Tod mehr als 70 Jahre vergangen sind. Was ist aber mit Bildern, für die noch Urheberrechtsschutz besteht? Hier erlaubt § 23 UrhG zwar die Erstellung von Bearbeitungen eines vorbestehenden Werkes, aber für die Veröffentlichung, wie etwa die Wiedergabe per Twitter, ist eine Erlaubnis der Urheber des Ausgangswerkes (oder von deren Erben) erforderlich.

Zustimmung der Urheber ist erforderlich

§ 23 UrhG

Bearbeitungen oder andere Umgestaltungen eines Werkes, insbesondere auch einer Melodie, dürfen nur mit Zustimmung des Urhebers veröffentlicht oder verwertet werden. Wahrt das neu geschaffene Werk einen hinreichenden Abstand zum benutzten Werk, so liegt keine Bearbeitung oder Umgestaltung im Sinne des Satzes 1 vor.

Bearbeiter können gemäß § 3 UrhG ein eigenes Bearbeiterurheberrecht erwerben, wenn die Änderungen selbst wieder auf einer "persönlichen geistigen Schöpfung" beruhen. Damit kann bei Bildern, deren Schutzfrist abgelaufen ist, neuer Urheberrechtsschutz nur entstehen, wenn ein Mensch eine eigene Gestaltung – zum Beispiel durch Einsatz von KI als Werkzeug – vorgenommen und das Gestalten nicht alleine der KI überlassen hat.

Beim Inpainting werden nur Teile eines vorbestehenden Bildes verändert. Hier gilt Ähnliches wie beim Outpainting: Ein bestehendes Urheberrecht des vorbestehenden Werkes ist zu beachten. Ein Bearbeiterurheberrecht an dem veränderten Bild entsteht nur, wenn KI als gestaltendes Tool eingesetzt wurde, da ist die Lage nicht anders als beim Einsatz von Photoshop und anderen Programmen zur Bildbearbeitung.

Besonders interessant ist die Möglichkeit, in einem Grafikprogramm oder von Hand eine Skizze zu erstellen und diese dann durch ein KI-Tool ausgestalten zu lassen.

Interessante Möglichkeit: eine Skizze erstellen und diese durch ein KI-Tool ausgestalten lassen.

(Bild: GitHub/ CompVis, Team Stable Diffusion)

Die Verwendung eines KI-Modells als Tool ist aber nicht auf die Fälle des In- und Outpaintings oder der Bearbeitung vorbestehender Bilder beschränkt. Denn auch bei dem bloßen Einsatz von Prompts lässt sich das Ergebnis zum einen durch die Auswahl der Vorgaben durch den Text als auch durch weitere Konfigurationseinstellungen beeinflussen und damit gestalten. So können per Prompt für fotorealistische Ergebnisse etwa Vorgaben wie ein Kameramodell, das zu verwendende Objektiv, Lichtverhältnisse und die Tiefenschärfe gemacht werden, die das Ergebnis erheblich beeinflussen, wie das Beispiel in folgender Abbildung zeigt.

Dieses Eichhörnchenfoto ist KI-generiert mit Stable Diffusion. Textprompt: "Photo of squirrel on branch, 800mm lens, long exposure, Bokeh, Nikon Z FX, vivid colors"

Auch die Reihenfolge der in dem Prompt verwendeten Begriffe spielt für die Gewichtung und damit das Ergebnis eine Rolle. Zudem können mithilfe "negativer Prompts" unerwünschte Effekte oder Gestaltungen unterbunden werden.

Zusätzlich zu der Beeinflussung durch Prompts hängt das Ergebnis eines Text-to-image-Prozesses von den Einstellungen der Parameter in der eingesetzten Software ab. Durch die Classifier-Free Guidance Scale lässt sich bestimmen, inwieweit das Modell dem Prompt folgen soll oder "kreative Freiheit" besitzt. Entsprechend stark oder schwach finden sich die Vorgaben aus dem Prompt in dem Bild wieder. Je umfangreicher die Vorgaben im Text, desto höher muss die Guidance Scale sein, um diese Vorgaben auch erkennbar umzusetzen.

Mithilfe der "Steps" kann die Anzahl der von dem Modell durchzuführenden Denoising-Schritte bestimmt werden, was sich ebenfalls auf das Ergebnis auswirkt, wobei bei einer höheren Anzahl die Bilder ausdifferenzierter werden.

Beispiele für ein fotorealistisches KI-Bild und dessen Weiterbearbeitung. Links: Verwendung von 20 Steps (dem Eichhörnchen fehlt ein Bein...). – Rechts: Verwendung von 45 Steps bei gleichem Prompt und Seed (das Eichhörnchen schaut realistischer aus).

Durch die Angabe des "Seeds" wiederum lässt sich der Startpunkt für die Initialisierung vorgeben. Dies ist deswegen von Bedeutung, weil durch die Angabe eines konkreten Seeds bei ansonsten gleichen Parametern und Prompt ein identisches Bild erzeugt werden kann. Entsprechend ist durch kleinere Variationen des Prompts eine Detailgestaltung des Outputs möglich (Beispiele bei GetImg.AI). Auch durch die "img2img"-Funktion, bei der ein zunächst generiertes Bild als Input für die weitere Bearbeitung verwendet wird, kann eine Gestaltung des Outputs vorgenommen werden.

Durch die Auswahl eines Diffusion-Samplers wird schließlich die Art der Berechnung des nächsten Denoising-Schritts beeinflusst, was wiederum Einfluss auf die erforderlichen Schritte und die Dauer der Berechnung hat (vertiefende Informationen finden sich in einem Vergleich zu den Schedulern bei Hugging Face und zu den Stable-Diffusion-Samplern bei Artstation).

Daher überrascht es nicht, dass der Anwalt von Kris Kashtanova in seiner Gegendarstellung einige der von Kashtanova eingesetzten Gestaltungsmöglichkeiten aufgreift und die Arbeit als iterativen Prozess der Auswahl und Ausdifferenzierung der Bilder beschreibt.

In der Tat kennt das Urheberrecht die Auswahl als ein schöpferisches Element, wie § 4 UrhG für Sammelwerke zeigt. So kann zum Beispiel durch die Auswahl und Anordnung von Gedichten oder Musikstücken ein eigenes Recht am Sammelwerk entstehen. Es ist daher folgerichtig, dass Kashtanova ein Urheberrecht an ihrer Bildergeschichte zugestanden wurde, nicht aber an jedem einzelnen mit KI erzeugten Bild.

Angesichts der schon komplizierten Abgrenzung von urheberrechtlich nicht geschützer KI-Kunst und geschützten Werken, bei denen KI als Tool zur Gestaltung eingesetzt wurde, stellen sich einige ungeklärte Folgefragen. Wenn dem Ergebnis nicht mehr anzusehen ist, ob eine menschliche Gestaltung vorgenommen wurde, stellt sich zum Beispiel das Problem der Beweislast, wenn eine Urheberrechtsverletzung geltend gemacht wird.

Kristina Kashtanova hatte den Schaffensprozess von "Zarya of the Dawn" dokumentiert.

(Bild: Kristina Kashtanova)

Besteht eine Vermutung für eine menschliche Gestaltung oder muss der Schöpfungsprozess dokumentiert werden, wie dies Kashtanova zumindest teilweise getan hat? Ist es überhaupt noch sinnvoll, für Urheberrechtsschutz auf eine menschliche Gestaltung abzustellen? Was macht dann noch den Kern des Urheberrechts aus?