Der Pragmatische Architekt

Neueste Artikel zum Thema

Large Language Models: Die Mathematik hinter Transformers

Die Transformer-Architektur findet sich heute in allen Large Language Models. Aber wie genau funktioniert sie? Der Artikel klärt die mathematischen Hintergründe

Was ist die Disziplin Softwarearchitektur?

Das Paradox der Softwarearchitektur

Die Frage ob Softwarearchitektur eine Kunst, Wissenschaft, Ingenieurwesen oder etwas völlig Neues bezeichnet, treibt die Community schon lange um.

heise+ Jubiläumsspecial

Sichern Sie sich unser exklusives Aktionsangebot: heise+ 7 Monate für 7 € pro Monat lesen und zusätzlich zu allen Inhalten auf heise online unsere Magazin-Inhalte entdecken. Nur für kurze Zeit!

Ein Tag im Leben eines Softwarearchitekten – Überleben im Unternehmensdschungel

Produktivität gehört zu den wichtigsten Qualitäten der Softwareentwicklung, wenn auf dem Weg nicht so viele hemmende Hindernisse lauern würden.

Arduino-Übernahme durch Qualcomm: Entscheidender Moment für die Maker-Community

Qualcomms geplante Übernahme des italienischen Unternehmens Arduino weckt in der Community gleichzeitig Hoffnung und vorsichtige Bedenken.

Künstliche Neuronale Netze im Überblick 11: Implementierung eines Transformers

Transformer-Architekturen verarbeiten Prompts, um daraus Rückmeldungen zu liefern. Zusätzlich findet dort häufig Reinforcement Learning statt.

Künstliche Neuronale Netze im Überblick 10: Graphneuronale Netzwerke

Graph Neural Networks eignen sich dank der Graphenstruktur für Deep Learning mit Daten, deren Beziehungen sich durch Knoten und Kanten ausdrücken lassen.

Künstliche Neuronale Netze im Überblick 9: Die Zukunft Neuronaler Netze

Ansätze wie Attention-Only-Modelle und selbstüberwachtes Lernen eröffnen neue Möglichkeiten im Bereich der Künstlichen Intelligenz.

Künstliche Neuronale Netze im Überblick 8: Hybride Architekturen

Der achte Teil der Serie zeigt, wie hybride Architekturen die Stärken von Convolutional-, Recurrent- und Attention-basierten Schichten kombinieren.

Künstliche Neuronale Netze im Überblick 7: Rekursive neuronale Netze

Der siebte Teil der Serie zeigt rekursive neuronale Netze, die besonders gut für die Verarbeitung sequenzieller Daten geeignet sind.

Künstliche Neuronale Netze im Überblick 6: Convolutional Neural Networks

Der sechste Teil der Serie widmet sich Convolutional Neural Networks mit ihren Faltungsschichten und zeigt einfache Codebeispiele für die Bildverarbeitung.

Künstliche Neuronale Netze im Überblick 5: Trainingsschleifen und Batching

Der fünfte Teil der Serie widmet sich Trainingsschleifen und vergleicht das Training mit und ohne explizite Mini-Batches.

Künstliche Neuronale Netze im Überblick 4: Verlustfunktionen

Der vierte Teil der Serie beschreibt Verlustfunktionen, die ermitteln, wie gut die Vorhersagen eines Netzwerks mit den gewünschten Zielen übereinstimmen.

Künstliche Neuronale Netze im Überblick 3: Aktivierungsfunktionen

Der dritte Teil der Serie zeigt die Vorwärtsausbreitung und Aktivierungsfunktionen für das Zusammenspiel der Layer im neuronalen Netzwerk.

Künstliche Neuronale Netze im Überblick 2: Schichten und Feed-Forward-Netzwerke

Der zweite Teil der Serie zeigt, wie mehrere Neuronen, die sich die Eingaben teilen und parallel Ausgaben erzeugen, die Schicht eines Neuronalen Netzes bilden.

Künstliche Neuronale Netze im Überblick 1: Das künstliche Neuron

Der erste Teil der Serie stellt den Grundbaustein für künstliche neuronale Netze vor: das von biologischen Neuronen inspirierte künstliche Neuron.

Quantencomputing: Ein Paradigmenwechsel für die Softwareentwicklung

Das Zeitalter des Quantencomputing rückt immer näher, doch was ist Quantencomputing und wie können sich Developer schon heute damit vertraut machen?

Mikrocontroller-Programmierung: All-in-One Starter Kits für Arduino und Pico 2

Die All-in-one Starter Kits von Elecrow sind dafür geeignet, Anfängern den Einstieg in das Thema Microcontroller zu erleichtern.

Per Anhalter durch die KI-Galaxie – LLM-Crashkurs Teil 4

Der letzte Teil der Serie betrachtet Reasoning-Modelle und gibt einen Ausblick auf die mögliche Zukunft der LLMs.

KI-generiertes Auto mit offener motorhaube und Datenstrukturen

Per Anhalter durch die KI-Galaxie – LLM-Crashkurs Teil 3

Die Artikelserie zeigt die internen Mechanismen großer Sprachmodelle von der Texteingabe bis zur Textgenerierung.

Per Anhalter durch die KI-Galaxie – LLM-Crashkurs Teil 2

Die Artikelserie zu den internen Mechanismen großer Sprachmodelle behandelt diesmal die benötigte Hardware und pretrained Models.

Per Anhalter durch die KI-Galaxie – LLM-Crashkurs Teil 1