KI-Tools mit zwei Klicks installieren | Pinokio ausprobiert

Wer aktuelle KI-Tools ausprobieren will, muss sich auf der Kommandozeile häufig mit Python-Versionen und ähnlichem herumschlagen. Pinokio machts viel einfacher.

In Pocket speichern vorlesen Druckansicht 15 Kommentare lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 11 Min.
Von
  • Jan-Keno Janssen
Inhaltsverzeichnis

Die Installation brandaktueller KI-Tools ist häufig nicht ganz trivial. Der "KI-Browser" Pinokio vereinfacht das schnelle Ausprobieren immens. c't 3003 hat's ausprobiert.

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, das sind einige der heißesten brandaktuellen KI-Tools, die ihr alle lokal bei euch installieren könnt. Mit AudioCraft könnt ihr zum Beispiel ungewöhnliche Geräusche generieren, hier, Krümelmonster isst Kekse beim Fernsehen. Oder mit Modelscope aus Fotos Videos machen. Oder mit Facefusion Gesichter in Videos austauschen. Oder hier mit RVC, könnt ihr Freddy Mercury Adele-Lieder singen lassen -- richtig spaßiges Zeug, ich muss zugeben, dass ich da bei der Recherche stundenlang mit dem ganzen Kram herumgespielt habt. Und der Spaß endet auch nicht, denn jeden Tag kommen neue Tools raus.

Aber wenn ihr solche brandaktuellen KI-Tools schonmal ausprobiert habt, dann wisst ihr, dass das so gut wie immer Getippe auf der Kommandozeile und Gefummel mit irgendwelchen Python-Versionen bedeutet und man ständig irgendwelche kryptischen Fehlermeldungen bekommt, weil irgendwas fehlt, irgendwelche Abhängigkeiten nicht erfüllt sind oder sonst irgendwas nicht genehm ist.

Ja, und jetzt kommts: Ich habe bei der Installation all dieser am Anfang erwähnten Tools nicht einmal irgendwas auf der Kommandozeile eingegeben. Sondern alles mit maximal zwei Mausklicks installiert. Und zwar ganz egal, ob auf Linux, Windows oder macOS. Möglich machts Pinokio, ein sogenannter KI-Browser. Richtig gutes Ding. Bleibt dran.

Liebe Hackerinnen, liebe Internetsurfer, herzlich willkommen hier bei...

Es ist ein Fakt: So gut wie alle aktuellen Open-Source-KI-Tools gibt es in Form von Python- oder Sonstwas-Skripten, die oft auch noch schlecht dokumentiert beim Code-Onlinedienst GitHub liegen. Hat man keine Python-Erfahrung, kann das ziemlich schnell überfordern -- aber auch mit Python-Skills rennt man oft wegen irgendwelche Wände, weil Tool xy eine ganz bestimmte PyTorch- oder Sonstwas-Version einfordert.

Und dagegen ist nun ein Kraut gewachsen: Pinokio, das sich selbst etwas seltsam "KI-Browser" nennt. Aber das Ding ist kein Browser, sondern ein Tool das automatisiert KI-Tools installiert; und zwar fein säuberlich abgeschottet voneinander, sodass ihr nicht, wenn ihr irgendeine Komponente für ein Tool updatet, das Problem habt, dass ein anderes Tool dann nicht mehr läuft. Kurzer Einschub: Klar, ich hab auch schonmal was von virtuelle Python-Umgebungen gehört, womit ihr das Problem natürlich auch manuell lösen könnt -- aber das Stichwort ist manuell, Pinokio macht das alles automatisch.

Bevor ich ans Eingemachte gehe, ein wichtiger Disclaimer: Pinokio ist ein Eine-Person-Projekt, entwickelt hat das ein Mensch namens Cocktail Peanut, der oder die auch schon Dalai gemacht hat, eines der ersten Tools, mit dem man große Sprachmodelle lokal laufen lassen konnte. Darüber hatten wir schonmal ein Video gemacht; und inzwischen gibt es übrigens für sowas auch deutlich bessere Tools als Dalai, zum Beispiel GPT4All.

Aber ja, Cocktail Peanut ist anonym, ich habe die Erdnuss mal auf X angeschrieben und freundlich nach den Hintergründen gefragt, und Cocktail Peanut war zwar nett, aber wollte auf weitere Details nicht antworten. Ist ja auch völlig ok, wenn man anonym bleiben will, gibt es ja gute Gründe für.

Aber: Das macht natürlich die Einschätzung der Vertrauenswürdigkeit etwas schwierig. Euch muss klar sein: Pinokio führt Code aus auf eurem Rechner, Pinokio lädt selbstständig Code nach -- und ja, da können natürlich schlimme Dinge passieren. Aber: Pinokio ist Open-Source, und die Installation-Skripte für die KI-Tools ebenfalls, man kann sich also auf GitHub relativ genau angucken, was da passiert. Trotzdem: Ich habe euch zumindest gewarnt.

So, wie wird das nun installiert? Ja, supereinfach. Auf pinokio.computer gehen, dann auf Download, dann euer Betriebssystem auswählen, downloaden. Ja und unter Windows einmal Entpacken, dann die pinokio-setup-exe ausführen. Windows SmartScreen meckert dann einmal, da könnt ihr beherzt auf "Weitere Informationen" klicken und dann hier "Trotzdem ausführen". Ja, und dann wird das installiert.

Habt ihr macOS, klickt ihr hier auf Download für M1/M2 bzw. Intel Macs. Dann einfach das DMG doppelklicken, wie üblich auf Anwendungen ziehen, aber dann müsst ihr noch einmal hier auf "Patch command" rechtsklicken und "Offnen" klicken. Einmal Systempasswort eingeben, ok, ihr könnt alle Fenster schließen.

Habt ihr LInux, werdet ihr auf Github umgeleitet. Hier müsst ihr euch dann die passende Pinokio-Variante raussuchen. Mit "AppImage"-Endung ist das zum Beispiel für Ubuntu-Varianten (zum Beispiel auch Mint) vorgesehen, mit deb-Endung für Debian-Geschmacksrichtungen. Einfach drauf doppelklicken dann. Zack, fertig.

Ja, und ab dann arbeit Pinokio auf allen Betriebssystemen identisch. Beim ersten Start müsst ihr einmal auf "Setup" klicken, und dann installiert Pinokio grundlegendes Zeugs. Das kann ein paar Minunten dauern, also nicht wundern. Ja, und dann könnt ihr losspielen. Zurück kommt ihr übrigens immer, wenn ihr auf dieses Puzzlestück-artige Icon da oben links klickt. Ja, das sind die hier oben die "Featured"-Installationsskripte, hier unten ist das chronologisch geordnet.

Übrigens nochmal zur Erklärung: Mit den Tools selbst hat der Mensch hinter Pinokio nix zu tun, Cocktail Peanut baut leidiglich Pinokio und die Pinokio-Installationsskripte für die KI-Tools.

Ich kann euch ja mal kurz die meiner Meinung nach interessantesten Sachen vorstellen:

Das hier ist Stable Diffusion WebUI, auch bekannt als Automatic1111. Stable Diffusion ist die zurzeit zweifellos beste Open-Source-Text-zu-Bild-Generator. Ich würde sagen er ist ein ganz klein wenig schlechter als Midjourney -- aber Midjourney ist ja auch nicht Open-Source und läuft nicht lokal. StableDiffusion ist auf jeden Fall VIEL flexibler als Midjourney, ihr könnt damit ganz wilde Sachen machen, Controlnet hatte ich ja schonmal als Video vorgestellt. Automatic1111 ist so die old-school Benutzeroberfläche von Stable Diffusion, schön ist die nun gar nicht. Und einfach zu bedienen auch nicht. Und deshalb kann man über Pinokio auch andere User-Interfaces installieren, zum Beispiel das andere Extrem: Fooocus mit drei o, das ist dann super clean und null frickelig. Einfach eintippen, was ihr sehen wollt: Zack.

Oder ihr könnt auch ComfyUI über Pinokio installieren, das ist das dann so Node-mäßig, ist ja auch gerade schwer angesagt.

Und ganz neu: Illusion Diffusion, damit könnt ihr so ganz nice optische Illusionen herstellen -- das würde auch mit den anderen UIs und Controlnet gehen, aber damit geht es viel einfacher. Hier, ich hab mal das c't-Logo hier eingebaut. Seht ihr das? Kneift mal die Augen zusammen oder geht etwas zurück. Nice, ne? Falls ihr übrigens schicke QR-Codes basteln wollt: Könnt ihr damit auch machen, einfach QR-Code-Bild einladen und dann hier hinschreiben, was ihr sehen wollt, cute robots zum Beispiel. Hier darf der Illusion-Strength-Regler nicht unter 2,0 eingestellt werden, dann funktionierten die QR-Code bei unseren Tests nicht mehr. Aber ab 2,0 klappts aber problemlos.

Und es gibt natürlich nicht nur Standbilderzeugs, sondern auch Video:

Mit Facefusion könnt ihr einfach ein Video nehmen, und die Gesichter darin austauschen. Dafür braucht ihr, Achtung, nur ein einzelnes Foto. Die Ergebnisse sind so halbgut, aber spaßig ist das allemal. Es gibt sogar einen Webcam-Modus, in dem das Gesicht im Webcam-Livebild ausgetauscht werden kann.

Mit ModelScope Image2Video könnt ihr aus einem einzelnen Bild ein Video machen. Die Ergebnisse sind ziemlich weird, aber auch hier: Spaßig allemal. Mit ModelScope Video2Video lässt sich zum Beispiel die Bildqualität von Videos hochrechnen.

Und last not least in die Ton-Abteilung:

AudioCraft Plus generiert nicht nur beliebige Soundeffekte, sondern auch Musik. Hier, das soll Technopolka sein. Ok.... Mit Bark Voice Cloning oder XTTS werft ihr ein kurzes Sprachsample rein und könnt dann über Text-zu-Sprache Sprache mit eben dieser Stimme ausgeben. Also, genau das, wofür man bei ElevenLabs ein kostenpflichtiges Monatsabo braucht.

Von allen von Pinokio angebotenen Tools mein Favorit ist RVC. Nur ist das leider auch das in Sachen Legalität wohl problematischste. Was ihr damit machen könnt: Ihr nehmt irgendein Lied, trennt Gesangs- und Instrumentenspur (das geht mit RVC auch, hier im Tab !!!). Ja, und dann könnt ihr den Gesang auf der Gesangsspur von jemand anders singen lassen. Da finden sich im Netz Stimmodelle von ungefähr allen Sängerinnen und Sängern, die man sich so vorstellen kann. Ich mach das jetzt aus rechtlichen Gründen nicht vor, aber hier auf YouTube gibt es zum Beispiel ein Video, in dem jemand Freddie Mercury "Someone like you" von Adele singen lässt:

Das klingt krass echt, oder? Ja, finde ich auch. Wenn ihr 'ne Band habt, und gerne singt, euch eure Stimme aber eure Stimme nicht so gut gefällt: Ja, dann wisst ihr jetzt, was ihr mal ausprobieren könntet. Von mir habt ihr den Tipp aber nicht, ne?

Pinokio löst ein Problem, was zumindest bei mir schon sehr oft zu Frustrationen geführt hat. Es installiert automatisch brandaktuelle KI-Tools, ohne dass man sich mit irgendwelchen Python-Abhängigkeiten herumärgern muss. Und außerdem, das ist auch wirklich cool: Ist der Kram unter "Discover" wirklich gut kuratiert. Man kriegt also, jedenfalls so lange Cocktail Peanut diese Arbeit übernimmt, immer die coolsten, neuesten KI-Tools präsentiert, ohne, dass man da selbst ständig recherchieren muss. Also: Ich finds wirklich richtig nice.

Aber, wichtig: Pinokio ist Alpha-Software, wir haben noch längst keine Beta und ne 1.0 sowieso nicht. Das heißt, das ist alles mit heißer Nadel gestrickt, und manchmal funktionieren Sachen einfach nicht. Ich habe Pinokio unter Linux, macOS und Windows laufen gehabt; und ich habe auf jeder Plattform irgendwas gefunden, was nicht lief, dafür aber auf den jeweils anderen Plattformen. Pinokio ist was zum rumspielen, das ist nicht irgendwie hochgradig stabile Produktiv-Software. Also, regt euch nicht auf, wenn was nicht klappt, wartet einfach auf die neue Version; die kommt zurzeit spätestens nach drei Tagen. Also: viel Spaß! Tschüss!


c't 3003 ist der YouTube-Channel von c't. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen und Lukas Rumpler sowie die Video-Producer Şahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.

(jkj)