Mistral OCR 4: Dokumentenanalyse für 170 SprachenMistral AI hat OCR 4 vorgestellt. Das Modell liest nicht nur Text aus, sondern strukturiert Inhalte für Enterprise Search und RAG-Pipelines.
Scanner im Test: Kompakte Digitalisierer für Akten und Briefe bis 500 EuroEinzugscanner für Briefe und Akten arbeiten flott und belegen nur wenig Schreibtischplatz. Modelle ab 430 Euro scannen autonom zum NAS oder in die Cloud.
Microsoft veröffentlicht frühesten bekannten DOS-QuellcodeZum 45. Geburtstag von 86-DOS veröffentlicht Microsoft die frühesten bekannten Quellcode-Listings – transkribiert von vergilbten Endlospapierausdrucken.
Tipp: QR-Codes am Mac scannenIn immer mehr Publikationen, auf Plakaten oder Bildschirmen finden sich QR-Codes, die man abscannen soll. Wie geht das aber mit dem Rechner?
Tipp: Gescannte PDFs mit Spotlight durchsuchenWas tun, wenn Inhalte in PDF-Dokumenten einfach nicht aufgefunden werden? Dagegen helfen Apps, aber auch macOS-Bordmittel.
Smartpens: Ihr kurzes Dasein und warum sie vom Markt verschwunden sindAuf Papier schreiben, automatisch digitalisieren. Die Idee war gut und doch scheinen Smartpens komplett vom Markt verschwunden zu sein. Was wurde aus ihnen?
DeepSeek-OCR: Bilder vereinfachen Texte für große SprachmodelleDeepSeek experimentiert mit einem OCR-Modell und zeigt, dass komprimierte Bilder für Berechnungen auf GPUs speicherfreundlicher sind als viele Text-Token.
DeepSeek-OCR: Wie Bilder Chatbots helfen, lange Gespräche zu führenChinesische KI-Forscher wollen Chatbots mit Bildern bei langen Kontexten schnell und günstig halten. Optische Kontextkompression soll KI-Assistenten verbessern.
BentoPDF 1.0: Neues Open-Source-PDF-Werkzeug fürs Self-HostingDas neue Open-Source-Tool BentoPDF erscheint in Version 1.0 mit umfangreichen PDF-Funktionen, Docker-Integration und Fokus auf lokale Datenverarbeitung.
Im Test: Kompakte Drucker-Scanner-Kombi für den SchreibtischDer günstige HP LaserJet M234dw passt auf den Schreibtisch und druckt sehr flott, ist aber spärlich ausgestattet und hat nur ein kümmerliches Bedienfeld.
Google setzt die KI-gestützte Suchfunktion "Ask Photos" vorerst ausMithilfe Geminis werden Nutzer die Fotos-App von Google durchsuchen können. Doch es gibt Probleme mit dieser Funktion. Google will in zwei Wochen nachbessern.
Microsoft Fotos: OCR-Funktion und mehr KI-IntegrationMicrosoft verteilt eine aktualisierte Fotos-App an Windows Insider. Sie kann Texte mittels OCR extrahieren und integriert mehr KI.
Dokumenten-Spürhund: PDF Content Search im TestDie macOS- und iOS-App PDF Content Search erfasst große PDF-Sammlungen und Scans per OCR und durchsucht sie.
Hazel für macOS: Version 6.0 erkennt Texte und sortiert zurückNoodlesoft hat das beliebte Spezialwerkzeug zum Aufräumen von Ordnern und Files überarbeitet. Version 6 bietet einige Komfortfeatures.
Microsoft stellt Super Resolution für die Foto-App auf Copilot+-PCs vorMicrosoft stellt die KI-Anwendung "Superauflösung" für die Foto-App in Snapdragon-betriebenen Copilot+-PCs vor – zunächst nur für Insider.
Vorlesestift: Handscanner mit OCR und Sprachausgabe im TestDer Zeilenscanner IRISPen Reader 8 in Stiftform digitalisiert Textpassagen und liest sie dank eingebauter Texterkennung und Sprachausgabe gleich vor.
KI-Update kompakt: Voice Engine, Amazon Olympus, Supercomputer Stargate, Pixel 8Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
Programmieren mit Python: Kommandozeilenparameter auswerten mit Python ArgparseDas Argument Parser Argparse für Python ist ein Werkzeug, das bei der Parameterauswertung hilft, schnell Ergebnisse liefert und mit Ihrem Programm wächst.
ChatGPT: Warum KI-Erkennungswerkzeuge so leicht zu betrügen sindVerschiedene Programme nutzen KI, um von anderen KIs generierte Texte zu erkennen. Leider schneiden sie in der Praxis schlecht ab.
Scannen statt abtippen: Zeit sparen mit Apples Livetext auf iPhone, iPad und MacIBANs, Veranstaltungstermine, Rufnummern: Livetext nimmt Papierunterlagen ihren Schrecken. Wir verraten auch, wie Sie jeden Text und QR-Codes kopierbar machen.
Das ist fast ganz sicher eine Katze: Microsoft Azure-API für die BilderkennungVersion 4.0 des Microsoft Azure-Dienstes Computer Vision Image Analysis 4.0 macht die weitreichende Bildanalyse über eine einzelne API möglich.
Kamera-Scan-Funktion als Datenschleuder?Viele modernen Smartphones haben mittlerweile OCR-Funktionen. Läuft die Texterkennung dabei lokal oder landen Fotos und Text in der Cloud?