Lokale KI: Handschriftliche Notizen und Rezepte mit KI digitalisieren

Moderne Vision-LLMs wie Gemma 4 können auch Handschriften lesen. Wir zeigen einen lokalen KI-Workflow, der Bildinhalte analysiert und strukturiert extrahiert.

Artikel verschenken

65

(Bild: KI / heise medien)

14.04.2026, 22:29 Uhr

Lesezeit: 16 Min.

heise+ exklusiv

Von

Denny Gille

Lokale KI: Handschriftliche Notizen und Rezepte mit KI digitalisieren
- Vision-Modelle finden und lokal ausprobieren
Vorbereitungen: Diese Software braucht der Workflow
Aufbau des Skripts und Wissenswertes für individuelle Anpassungen
Umbau für Koch- und Backrezepte
Fazit

Omas Apfelkuchen ist der beste. Zum Glück hat sie ihr Rezept handschriftlich festgehalten. Mit einer Vision-KI archivieren Sie nicht nur das Apfelkuchen-Rezept in digitaler Form. Sie können Sammlungen an handschriftlichen Notizen oder textlastige Screenshots etwa als Text-Dokumente oder in einer Auszeichnungssprache speichern.

Spannend ist das gerade auch für Nutzer lokaler KI-Systeme. KI-Chatbots können zwar auch Bilder analysieren, sie haben aber oft strenge Nutzungslimits für Dateiuploads – selbst in den Bezahlversionen. Im lokalen Betrieb kann man die Modelle hingegen mit dutzenden Dateien in automatischen Prozessen füttern. Dabei lässt sich die KI zwingen, ihre Antworten in einem festen Schema auszugeben. Die Ergebnisse kann man automatisiert als Markdown-Dateien exportieren, die sich wiederum in Notiz-Apps wie Obsidian organisieren lassen.

Bilder betrachten, Handschriften lesen, Texte extrahieren: Das bieten Vision-LLMs. Und sie lassen sich auch lokal auf dem eigenen KI-Rechner nutzen.
Wir stellen einen Python-Workflow vor, mit dem Sie Texte aus handschriftlichen Notizen, Fotos oder Screenshots extrahieren und weiterverarbeiten können. Das Ergebnis erscheint in einer übersichtlichen Markdown-Struktur.
Um eigene Ideen umzusetzen, lässt sich das Python-Skript einfach anpassen und spezialisieren.

Der Artikel stellt einen Python-Workflow vor, in dem das kostenlose Vision-LLM Gemma4 Bilder wie Notizen, Rezepte und Screenshots aus einem Eingabe-Ordner verarbeitet. Es kann den Inhalt der Bilder wiedergeben, zusammenfassen, kategorisieren und das Ergebnis jeweils in einer Markdown-Datei speichern. Wir haben das Projekt auf einem Windows-PC mit einer Nvidia-Grafikkarte erstellt und ausprobiert. Wie man das Skript individuell umbaut, zeigen wir am Beispiel von Rezepten: Das Skript ist auf deutsch- und englischsprachige Koch- und Backrezepte angepasst.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

EUDI-Wallet: Das ist der aktuelle Stand der digitalen europäischen Brieftasche

Die digitale Brieftasche als Smartphone-App soll ab 2027 einen einheitlichen Rahmen für rechtssichere digitale Authentifizierung setzen.

Zweieiige Zwillinge: Honor 600 und 600 Pro im Vergleichstest

Die beiden Honor-Smartphones sehen ähnlich aus, liegen allerdings leistungsmäßig ein ganzes Stück auseinander – und auch preislich.

Famos fensterln: So behalten Sie im macOS-Fensterdschungel den Überblick

Der Mac bietet zahlreiche Bordmittel wie Mission Control, Spaces, Vollbild und Stage Manager, um Fenster zu verwalten. Wir zeigen, wie man sie sinnvoll nutzt.

Open-Source-Grundausstattung: Freie und kostenlose Apps für Ihren Desktop

Sie haben keine Lust mehr auf Abhängigkeit von Adobe- und Microsoft-Abos? Quelloffene Software sorgt für den Befreiungsschlag auf dem Desktop – und spart Geld.

Mann lädt Elektroauto vor seinem Haus mit Sonnenkollektoren

Dienstwagen mit eigenem PV-Strom laden: Zwischen Einspeisung und Erstattung

Wer den E-Dienstwagen daheim lädt, kann sich den Strom steuerfrei erstatten lassen. Mit PV-Überschuss ist das eine Alternative zur Einspeisevergütung.