LLM lokal: Handschriftliche Notizen, Rezepte & Co. mit Vision-KI digitalisieren
Vision-Modelle finden und lokal ausprobieren
Vorbereitungen: Diese Software braucht der Workflow
Aufbau des Skripts und Wissenswertes für individuelle Anpassungen
Umbau für Koch- und Backrezepte
Fazit
Omas Apfelkuchen ist der beste. Zum Glück hat sie ihr Rezept handschriftlich festgehalten. Mit einer Vision-KI archivieren Sie nicht nur das Apfelkuchen-Rezept in digitaler Form. Sie können Sammlungen an handschriftlichen Notizen oder textlastige Screenshots etwa als Text-Dokumente oder in einer Auszeichnungssprache speichern.
Spannend ist das gerade auch für Nutzer lokaler KI-Systeme. KI-Chatbots können zwar auch Bilder analysieren, sie haben aber oft strenge Nutzungslimits für Dateiuploads – selbst in den Bezahlversionen. Im lokalen Betrieb kann man die Modelle hingegen mit dutzenden Dateien in automatischen Prozessen füttern. Dabei lässt sich die KI zwingen, ihre Antworten in einem festen Schema auszugeben. Die Ergebnisse kann man automatisiert als Markdown-Dateien exportieren, die sich wiederum in Notiz-Apps wie Obsidian organisieren lassen.
Bilder betrachten, Handschriften lesen, Texte extrahieren: Das bieten Vision-LLMs. Und sie lassen sich auch lokal auf dem eigenen KI-Rechner nutzen.Wir stellen einen Python-Workflow vor, mit dem Sie Texte aus handschriftlichen Notizen, Fotos oder Screenshots extrahieren und weiterverarbeiten können. Das Ergebnis erscheint in einer übersichtlichen Markdown-Struktur.Um eigene Ideen umzusetzen, lässt sich das Python-Skript einfach anpassen und spezialisieren.
Der Artikel stellt einen Python-Workflow vor, in dem das kostenlose Vision-LLM Gemma4 Bilder wie Notizen, Rezepte und Screenshots aus einem Eingabe-Ordner verarbeitet. Es kann den Inhalt der Bilder wiedergeben, zusammenfassen, kategorisieren und das Ergebnis jeweils in einer Markdown-Datei speichern. Wir haben das Projekt auf einem Windows-PC mit einer Nvidia-Grafikkarte erstellt und ausprobiert. Wie man das Skript individuell umbaut, zeigen wir am Beispiel von Rezepten: Das Skript ist auf deutsch- und englischsprachige Koch- und Backrezepte angepasst.
Das war die Leseprobe unseres heise-Plus-Artikels “LLM lokal: Handschriftliche Notizen, Rezepte & Co. mit Vision-KI digitalisieren”.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
Dieser Link ist leider nicht mehr gültig.
Links zu verschenkten Artikeln werden ungültig,
wenn diese älter als 7 Tage sind oder zu oft aufgerufen wurden.
Sie benötigen ein heise+ Paket, um diesen Artikel zu lesen. Jetzt eine Woche unverbindlich testen – ohne Verpflichtung!
Quelle:
www.heise.de



