Wie eine lokale KI die Fotosammlung auf dem NAS verschlagworten kann
Fotos sind mit dem Smartphone schnell gemacht. Eine lokale KI verschlagwortet sie anhand des Inhalts – direkt auf dem NAS ohne leistungsfähige Grafikkarte.
- Ramon Wartala
Seit jedes Smartphone eine Digitalkamera hat, wird so viel geknipst wie noch nie. Doch wer mistet noch regelmäßig die Bilderflut aus? Stattdessen landen die Fotos auf dem PC oder dem heimischen NAS, wenn der Speicher des Smartphones voll ist. Wenn man sie nicht eh gleich der Cloud überantwortet. Wer die Kontrolle über seine Daten behalten will, organisiert private Bilder deshalb lieber selbst. Doch in den Fotobergen das eine zu finden, das man gerade braucht, ist allein aufgrund der schieren Menge ein Problem. Und die Menge verhindert meist auch, die Fotos thematisch zu sortieren. Abhilfe verheißt eine KI, die Bilder analysiert und sie mit Schlagworten versieht.
Solche multimodale große Sprachmodelle (Large Language Models, LLM), die neben Text auch visuelle Inhalte verarbeiten können, bieten OpenAI, Google und anderen Firmen an, üblicherweise in einem Abo-Modell. Diese zu nutzen würde aber neben den Kosten wiederum bedeuten, die eigenen Bilder aus der Hand zu geben.
Mit LlaVA (Large Language Visual Assistant Modell) gibt es aber auch ein Open-Source-Modell, das aus einer Forschungskooperation von Microsoft mit den Universitäten Madison (Wisconsin) und Berkeley (Kalifornien) entstanden ist und das Sie vollständig lokal betreiben können.
Das war die Leseprobe unseres heise-Plus-Artikels "Wie eine lokale KI die Fotosammlung auf dem NAS verschlagworten kann". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.