GPT selbst bauen: So geht es am Mac mit Swift

Generative vortrainierte Transformer erstellen Texte oder fassen sie zusammen und klingen dabei sehr menschlich. So programmieren Sie GPTs selbst auf dem Mac.

Artikel verschenken

Ein GPT-Shakespeare.

(Bild: SwapStock, freepik.com; Montage: Mac & i)

07.08.2024, 08:00 Uhr

Lesezeit: 17 Min.

Mac & i

Von

Jürgen Schuck

GPT selbst bauen: So geht es am Mac mit Swift
- Wie ein Transformer arbeitet
GPT selbst programmieren
Der Beispiel-GPT im Überblick
Lernen und Trainieren
Fazit: Bislang nur Text, bald auch Video?

Ein Beatles-Song soll die Ingenieure von Google auf die Idee gebracht haben, "Attention is all you need" als Titel für ein Paper zu wählen, in dem sie 2017 eine Architektur für ein KI-System beschreiben, dessen Stärke im Verarbeiten natürlicher Sprache (Natural Language Processing, kurz NLP) liegt. Es kombiniert verschiedene Typen neuronaler Netzwerke auf pfiffige Weise mit anderen bekannten KI-Konzepten zu einem sogenannten Transformer und ergänzt einen neuartigen Eingabemechanismus, der sich zudem prima parallelisieren lässt. Das Paper wurde zur Grundlage generativer KI-Systeme, die praktisch ausnahmslos Transformer sind und diesem Konzept folgen. Für das Verständnis hilfreich, aber nicht erforderlich, ist die Kenntnis des Artikels "Das eigene KI-Modell programmieren" auf heise+. Den Code und andere Infos finden Sie hier.

Wie ein Transformer arbeitet

Ein Transformer berechnet auf Basis seines Trainings die wahrscheinlichsten Werte, die eine gegebene Datenreihe vervollständigen oder fortsetzen. Im NLP ist das ein Text, den beispielsweise ChatGPT zu einer Geschichte ausbaut. Dazu muss der Text numerisch repräsentiert sein, als sogenanntes Embedding. Es bildet die Semantik eines oder mehrerer Worte als Vektor ab, mit dem sich rechnen lässt. Ein sehr einfaches Beispiel soll das Prinzip verdeutlichen: König − Mann + Frau = Königin.

Generative vortrainierte Transformer (GPT) können textuelle Kontexte erfassen und fortschreiben.
Weiteres Training mit spezifischen Inhalten ermöglicht es, Texte zu bestimmten Themen zu erzeugen.
Das Pretraining des GPT erfolgt mit dem GPT-2-Modell von OpenAI und Werken von Shakespeare.

Embeddings sind mehrdimensionale Vektoren, die einen mathematischen Umgang mit den semantischen Abständen von Worten ermöglichen. Dieses Konzept aus der Toolbox des NLP verwenden auch die Transformer. Sie arbeiten allerdings mit Token, die neben Worten auch Silben und andere Buchstabenfolgen repräsentieren, was den Umgang mit Fremdwörtern erleichtert.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

AVR-Programme debuggen, Teil 2

Compiler entfernen zur Ressourcenschonung Überflüssiges, was Fehler verursachen kann. Debugger identifizieren diese durch Einblick in den Assembler-Code.

Raspberry Pi Pico 2 im Test: Schnellere Kerne und RISC-V für 5 Euro

Das neue Board ist flinker als sein Vorgänger. Viel interessanter sind jedoch die zwei zusätzlichen RISC-V-Kerne. Wir haben uns das mal näher angeschaut.

So richten Sie den Raspberry Pi schnell und komfortabel ein

Die Zeiten, in denen die Raspi-Einrichtung eine frickelige Tagesaufgabe war, sind längst vorbei – inzwischen ist ein Raspberry Pi nach wenigen Klicks startklar.

Raspi 5 als Desktop-Ersatz

E-Auto Renault Scenic E-Tech 220 im Test: Alternative zum Tesla Model Y

Mit 87 kWh bietet der Renault Scenic die größte Batterie im Segment, lädt jedoch nur durchschnittlich flink. Komfort und Verarbeitung sind ziemlich gut.

Wissensmanagement: Einführung in Obsidian

Es fallen immer Unmengen von Daten an, die gespeichert, sortiert und verknüpft werden wollen. Ideal ist dafür ein Wissensmanagementprogramm wie Obsidian.

BASPi: Backup und Sync ohne Cloud mit einem Raspi einrichten

Unser BASPi synchronisiert Ihre Dateien auf all Ihren Geräten und kümmert sich auch noch um sichere Backups. Dafür taugt jeder alte Raspi oder Rechner.

Raspi einrichten

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}