c’t-Material zum KIKUK-Wettbewerb

Zusatzmaterial zum c’t-Webinar für KIKUK, den KI-Kunstwettbewerb des Goethe-Instituts.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 14 Min.
Inhaltsverzeichnis

Hier findet ihr die Folien von unserem Webinar und einige Artikel aus der c’t, die vielleicht interessant für euch sind und Antworten auf häufige Fragen zu generativer KI.

Präsentationsfolien:

1. Einleitung

2. Bild-KIs

3. Algorithmische Musik mit ChatGPT

4. Video-KIs

c’t-Artikel:

Im Folgenden findet ihr Antworten auf häufige Fragen zu KI, zu den Problemen mit generativer KI und zur Benutzung dieser Werkzeuge. Weiter unten findet ihr auch eine Liste von KI-Werkzeugen für verschiedene Zwecke.

Was ist "Künstliche Intelligenz"?Was ist "generative KI"?Wieso entwickelt KI sich so schnell?Wie funktioniert generative KI?Sind KIs intelligent?Wer forscht an KI?Ist KI kostenlos?

Woher kommen die Trainigsdaten für KI?Was für Fehler macht KI?Ist generative KI gefährlich?

Wie bedient man generative KIs?Welche Sprachen sprechen die KI-Tools?Was mache ich, wenn ein KI-Tool in meinem Land nicht verfügbar ist?Kann generative KI jede Art von Text, Bild oder Video erstellen?Was mache ich, wenn das Bild oder Video nicht richtig aussieht?Was mache ich, wenn ein Video zu kurz ist?

Was ist "Künstliche Intelligenz"?

"Künstliche Intelligenz" oder "KI" ist ein alter Begriff. Er wird schon seit 1956 in der Informatik verwendet. Im Laufe der Zeit wurden verschiedene Arten von Computersystemen als "KI" bezeichnet. In letzter Zeit meint man oft "generative KI", wenn man "KI" sagt. Das sind KI-Systeme die Texte, Bilder oder Musik machen ("generieren"). Es gibt aber noch viele andere Arten von KI, an denen geforscht wird. Zum Beispiel nutzen selbstfahrende Autos auch viel KI, aber keine generative KI.

Was ist "generative KI"?

Generative KI sind Computersysteme, die etwas produzieren, zum Beispiel Text oder Bilder. Man nennt solche Systeme oft "Modell". Aktuelle KIs, die Text produzieren, heißen zum Beispiel "große Sprachmodelle" (large langeuage models, LLM). Diese Systeme sind neu, und stehen im Mittelpunkt des aktuellen KI-Hypes. Der Hype kommt daher, dass generative KI sich schnell entwickelt. Vor wenigen Jahren hätte fast niemand gedacht, dass Computer heute so gute Texte schreiben und Bilder malen können. (Kleiner Tipp: Dem Sprachmodell Soekia GPT kann man zusehen wie es arbeitet. Es ist speziell dafür gemacht zu lernen, wie ein Sprachmodell funktioniert: https://www.soekia.ch/gpt.html)

Wieso entwickelt KI sich so schnell?

Nicht alle KI entwickelt sich so schnell. In der Geschichte von KI gab es immer wieder Phasen mit schneller Entwicklung, aber irgendwann ging es dann nicht mehr weiter. Man spricht auch von "KI-Wintern". Der aktuelle Fortschritt betrifft vor allem generative KI. Die Ursache sind neue technische Tricks, wie zum Beispiel die "Transformer Architektur". ("GPT" steht für "generative pre-trained transformer".)

Außerdem werden generative KI-Systeme besser, wenn man sie größer macht. Der Fortschritt in den letzten Jahren kommt auch daher, dass man mehr Geld ausgegeben hat, um größere KI-Modelle zu trainieren. Das ist überraschend, viele Arten von KI werden nicht besser, nur weil man sie größer macht. Man weiß nicht, ob generative KI immer noch besser wird, wenn man sie immer noch größer macht. Vielleicht kommt dann wieder ein "KI-Winter".

Wie funktioniert generative KI?

Generative KI braucht riesige Datenmengen (wie viele andere Arten von KI auch). Also zum Beispiel große Text- oder Bildsammlungen. Darin versucht die KI, Muster zu erkennen. Zum Beispiel lernt eine Bild-KI, welche Bilder zu welchen Bildbeschreibungen passen. Wenn man ihr danach eine Bildbeschreibung gibt, kann sie ein dazu passendes Bild erstellen. Sie versteht aber nicht wie Menschen, was auf dem Bild zu sehen ist.

Sind KIs intelligent?

Das ist eine schwierige Frage. Die Antwort hängt davon ab, was man unter "intelligent" versteht. Die meisten Experten sagen, dass heutige KIs nicht wirklich intelligent sind, zumindest nicht so wie Menschen. Manche KI-Forscher glauben aber, dass man mit generativer KI in Zukunft wirklich intelligente Systeme bauen kann. Vielleicht sogar Systeme, die klüger als Menschen sind. Viele Experten denken aber, dass solche Systeme mit der aktuellen Technik nicht möglich sind.

Wer forscht an KI?

Es gibt große Konzerne, zum Beispiel Google oder Microsoft, die an KI forschen. Außerdem gibt es viele Start-Ups. Die sind klein, haben aber viel Geld von Investoren bekommen, um an KI zu forschen. Sie hoffen, dass sie das Geld irgendwann wieder einnehmen können, indem sie KI-Produkte verkaufen.

Außerdem wird KI an Universitäten erforscht und es gibt eine aktive Open-Source-Community. Denn kleine KI-Modelle kann man auch auf normaler Computerhardware trainieren. Diese Modelle sind nicht so beeindruckend, wie die großen Systeme von Google oder Microsoft, aber auch interessant. Auch manche Konzerne, zum Beispiel Facebook, machen ihre großen Modelle öffentlich. So kann jeder daran forschen. Die meisten frei zugänglichen Modelle und Datensätze findet man auf der Plattform "Hugging Face": https://huggingface.co

Ein KI-System auf dem eigenen Computer zu installieren, ist oft nicht ganz einfach. Man sollte sich gut mit Computern auskennen. Hier ist zum Beispiel eine Anleitung um die Bild-KI "Stable Diffusion" zu installieren: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki.

Ist KI kostenlos?

Nein, das ist sie nicht. Es gibt kleine KI-Systeme (siehe vorhergehende Frage), die man selbst betreiben kann. Dafür muss man nur ein bisschen Hardware und den Strom bezahlen.

Die meisten bekannten KI-Systeme, wie zum Beispiel ChatGPT, brauchen aber große Rechenzentren und sind sehr teuer. Außerdem müssen die Hersteller die Forschung und Entwicklung dieser Systeme bezahlen. Das sind oft viele Millionen oder sogar Milliarden Euro. Momentan verdient fast niemand Geld mit KI: Die Entwicklung und der Betrieb kosten viel mehr, als man durch Abos einnehmen kann. Trotzdem kann man viele dieser Systeme kostenlos testen. Die Hersteller wollen damit Werbung für ihre KI machen und Kunden binden. Bei vielen Systemen muss man sich deshalb einen Account anlegen, auch wenn man nur kostenlose Features ausprobieren möchte.

Woher kommen die Trainigsdaten für KI?

Die meisten Daten kommen aus dem Internet. Es gibt große Datenbanken, für Bilder zum Beispiel "Laion-5B" (Large-scale AI Open Network), mit 5,8 Milliarden Fotos und Bildbeschreibungen. Oft wurden die Urheber der Daten nicht gefragt hat, ob sie einverstanden sind. Viele Künstler wollen nicht, dass ihre Inhalte von KIs verwendet werden.

Deshalb haben manche Leute KI-Firmen verklagt. Die meisten dieser Gerichtsverfahren sind noch nicht entschieden. Andere Künstler versuchen ihre Werke mit technischen Tricks zu schützen. Sie verändern zum Beispiel Bilder so, dass sie für Menschen gleich aussehen, aber KIs beim Training in die Irre führen. Die meisten Forscher denken, dass solche Tricks nicht dauerhaft funktionieren. Generative KI wird immer besser, sodass neuere Versionen auf die Tricks wahrscheinlich nicht mehr hereinfallen.

Was für Fehler macht KI?

Generative KI weiß nicht, was wahr ist und was falsch. Sie produziert einfach Dinge, die so ähnlich sind, wie ihre Trainingsdaten. Die Texte, die Sprachmodelle generieren, klingen gut. Aber die KI prüft den Inhalt nicht. Deshalb stimmt es oft nicht, was ein Sprachmodell schreibt, auch wenn es richtig klingt.

Das gleiche Problem haben Bild- und Video-KIs. Sie zeigen Dinge, die gut aussehen. Die KI achtet nicht darauf, ob die Bilder wahr sind. Ältere oder schlechtere Bild-KIs malen zum Beispiel oft Hände, die zwar passend aussehen, aber zu viele Finger haben.

Video-KIs verändern oft Dinge unrealistisch. Zum Beispiel ändert sich plötzlich die Frisur oder Haarfarbe einer Person. Deshalb machen die meisten Systeme nur kurze Videos. So kann die KI weniger Fehler machen.

Ist generative KI gefährlich?

Die KI selbst ist nicht gefährlich. Aber man kann damit sehr leicht Texte, Bilder und Videos produzieren, die nicht wahr sind (siehe vorhergehende Frage). Das kann gefährlich sein, wenn Leute damit Fake-News produzieren. Oft passiert das sogar unabsichtlich, weil die KI Fehler macht und niemand das Ergebnis kontrolliert.

Viele Leute befürchten, dass man bald keinem Text und keinem Bild im Internet mehr trauen kann, weil sie von einer KI generiert sein könnten. Es gibt verschiedene Forschungsprojekte, um das zu verhindern. Aber es gibt noch keine gute Lösung.

Wie bedient man generative KIs?

Die meisten Systeme muss man "prompten". Das heißt, man muss einen (kurzen) Text schreiben, in dem man erklärt, was die KI machen soll. Das gilt nicht nur für Sprachmodelle, sondern für alle generativen KIs. Bei generativen Bild-KIs schreibt man zum Beispiel einen Text, in dem man das fertige Bild beschreibt. Nach diesem Text malt die KI dann das Bild.

Bei vielen Bild- und Video-KIs kann man auch ein Beispielbild angeben. Dann kann die KI den Stil dieses Bildes kopieren. So muss man den Stil nicht ganz genau beschreiben.

Prompten kann man üben. Mit der Zeit lernt man, was man schreiben muss, damit die KI ein gutes Ergebnis produziert. Google hat ein Spiel veröffentlicht, mit dem man prompten üben kann: https://artsandculture.google.com/experiment/jwG3m7wQShZngw In jedem Level muss man drei Bilder möglichst gut beschreiben. Das Spiel gibt es leider nur auf Englisch.

Welche Sprachen sprechen die KI-Tools?

Viele KI-Werkzeuge funktionieren in mehreren Sprachen. Wie gut eine KI eine Sprache beherrscht, hängt davon ab, mit wie vielen Texten in dieser Sprache sie trainiert wurde. Die meisten Trainingstexte aus dem Internet sind auf Englisch. Andere Sprachen kommen viel seltener vor.

Wenn eine KI in Deiner Sprache kein gutes Ergebnis liefert, versuch es mal auf Englisch. Die Antwort ist dann vielleicht besser.

Was mache ich, wenn ein KI-Tool in meinem Land nicht verfügbar ist?

Die meisten Hersteller schalten ihre Tools nach und nach in mehr Ländern frei. Das dauert aber oft sehr lange. Viele Hersteller konzentrieren sich zuerst auf ihr Heimatland und englischsprachige Nutzer.

Die einfachste Lösung ist, ein anderes Tool zu suchen. Hier sind ein paar Beispiele für bekannte Werkzeuge. Es gibt noch viel mehr, sie funktionieren alle ähnlich:

Für Bild-KIs:

Für Video-KIs:

Zur algorithmischen Musikproduktion:

Für Musik-KIs:

Für Text-KIs:

Kann generative KI jede Art von Text, Bild oder Video erstellen?

Ja, aber es funktioniert besser, wenn die KI viele ähnliche Dinge schon in ihren Trainingsdaten gesehen hat. Die Systeme können auch Dinge zeigen, die nicht in ihren Trainingsdaten sind. Aber dann muss man oft länger mit Prompts experimentieren, bis man zum gewünschten Ergebnis kommt.

Viele Anbieter filtern auch Nutzereingaben oder KI-Ausgaben. So wollen sie verhindern, dass Leute mit KI-Tools illegale oder unerwünschte Inhalte produzieren. Das Tool sagt dann zum Beispiel, dass es leider nicht helfen kann – oder es liefert einfach kein passendes Ergebnis.

Was mache ich, wenn das Bild oder Video nicht richtig aussieht?

Der einfachste Trick: Den Prompt ein bisschen anders schreiben. Auch bei ähnlichen Prompts machen die Tools nicht immer dasselbe. Vielleicht funktioniert es beim zweiten oder dritten Versuch besser. Manchmal hilft es, den Prompt auf Englisch zu schreiben.

Viele Tools verstehen negative Anweisungen nicht gut. Wenn man zum Beispiel sagt: "Ein Bild von Reis und Erbsen, aber ohne Möhren", dann sind oft trotzdem Möhren zu sehen. Viele Werkzeuge haben ein spezielles Eingabefeld für Dinge, die die KI nicht zeigen soll.

Es ist auch wichtig, nicht nur den Bildinhalt, sondern auch den Stil zu beschreiben. Dafür reichen Stichpunkte, je mehr desto besser; zum Beispiel so: "cyberpunk art, details and vivid colors, electric wallpaper, multicolored vector art, intricate, full res psychedelic therapy, ink splatters, pen lines, incredible detail".

Man kann auch den Namen von passenden Künstlern oder Bilderplattformen nennen, zum Beispiel: "inspired by Dan Mumford, trending on ArtStation". Bei vielen Werkzeugen kann man auch ein ähnliches Bild als Vorlage eingeben. Das ist oft einfacher, als den Stil ausführlich zu beschreiben.

Was mache ich, wenn ein Video zu kurz ist?

Aktuelle Video-KIs zeigen oft unrealistische Veränderungen. Zum Beispiel sehen Personen am Ende ganz anders aus als am Anfang. Sie machen deshalb nur kurze Clips, dann können weniger Fehler passieren.

Man kann viele Video-KIs aber auch mit einem Bild prompten. Daher gibt es diesen Trick, um ein Video zu verlängern: Man lässt die KI ein neues Video machen, mit dem letzten Bild des ersten Videos als Prompt. Das kann man auch wiederholen. Die fertigen Clips kann man dann mit einem normalen Videoschnittprogramm (zum Beispiel mit OpenShot) zusammenschneiden.

(syt)