Smartpens: Ihr kurzes Dasein und warum sie vom Markt verschwunden sindAuf Papier schreiben, automatisch digitalisieren. Die Idee war gut und doch scheinen Smartpens komplett vom Markt verschwunden zu sein. Was wurde aus ihnen?
DeepSeek-OCR: Bilder vereinfachen Texte für große SprachmodelleDeepSeek experimentiert mit einem OCR-Modell und zeigt, dass komprimierte Bilder für Berechnungen auf GPUs speicherfreundlicher sind als viele Text-Token.
heise+ JubiläumsspecialSichern Sie sich unser exklusives Aktionsangebot: heise+ 7 Monate für 7 € pro Monat lesen und zusätzlich zu allen Inhalten auf heise online unsere Magazin-Inhalte entdecken. Nur für kurze Zeit!
DeepSeek-OCR: Wie Bilder Chatbots helfen, lange Gespräche zu führenChinesische KI-Forscher wollen Chatbots mit Bildern bei langen Kontexten schnell und günstig halten. Optische Kontextkompression soll KI-Assistenten verbessern.
BentoPDF 1.0: Neues Open-Source-PDF-Werkzeug fürs Self-HostingDas neue Open-Source-Tool BentoPDF erscheint in Version 1.0 mit umfangreichen PDF-Funktionen, Docker-Integration und Fokus auf lokale Datenverarbeitung.
Im Test: Kompakte Drucker-Scanner-Kombi für den SchreibtischDer günstige HP LaserJet M234dw passt auf den Schreibtisch und druckt sehr flott, ist aber spärlich ausgestattet und hat nur ein kümmerliches Bedienfeld.
Google setzt die KI-gestützte Suchfunktion "Ask Photos" vorerst ausMithilfe Geminis werden Nutzer die Fotos-App von Google durchsuchen können. Doch es gibt Probleme mit dieser Funktion. Google will in zwei Wochen nachbessern.
Microsoft Fotos: OCR-Funktion und mehr KI-IntegrationMicrosoft verteilt eine aktualisierte Fotos-App an Windows Insider. Sie kann Texte mittels OCR extrahieren und integriert mehr KI.
Dokumenten-Spürhund: PDF Content Search im TestDie macOS- und iOS-App PDF Content Search erfasst große PDF-Sammlungen und Scans per OCR und durchsucht sie.
Hazel für macOS: Version 6.0 erkennt Texte und sortiert zurückNoodlesoft hat das beliebte Spezialwerkzeug zum Aufräumen von Ordnern und Files überarbeitet. Version 6 bietet einige Komfortfeatures.
Microsoft stellt Super Resolution für die Foto-App auf Copilot+-PCs vorMicrosoft stellt die KI-Anwendung "Superauflösung" für die Foto-App in Snapdragon-betriebenen Copilot+-PCs vor – zunächst nur für Insider.
Vorlesestift: Handscanner mit OCR und Sprachausgabe im TestDer Zeilenscanner IRISPen Reader 8 in Stiftform digitalisiert Textpassagen und liest sie dank eingebauter Texterkennung und Sprachausgabe gleich vor.
KI-Update kompakt: Voice Engine, Amazon Olympus, Supercomputer Stargate, Pixel 8Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
Programmieren mit Python: Kommandozeilenparameter auswerten mit Python ArgparseDas Argument Parser Argparse für Python ist ein Werkzeug, das bei der Parameterauswertung hilft, schnell Ergebnisse liefert und mit Ihrem Programm wächst.
ChatGPT: Warum KI-Erkennungswerkzeuge so leicht zu betrügen sindVerschiedene Programme nutzen KI, um von anderen KIs generierte Texte zu erkennen. Leider schneiden sie in der Praxis schlecht ab.
Scannen statt abtippen: Zeit sparen mit Apples Livetext auf iPhone, iPad und MacIBANs, Veranstaltungstermine, Rufnummern: Livetext nimmt Papierunterlagen ihren Schrecken. Wir verraten auch, wie Sie jeden Text und QR-Codes kopierbar machen.
Das ist fast ganz sicher eine Katze: Microsoft Azure-API für die BilderkennungVersion 4.0 des Microsoft Azure-Dienstes Computer Vision Image Analysis 4.0 macht die weitreichende Bildanalyse über eine einzelne API möglich.
Kamera-Scan-Funktion als Datenschleuder?Viele modernen Smartphones haben mittlerweile OCR-Funktionen. Läuft die Texterkennung dabei lokal oder landen Fotos und Text in der Cloud?
OCR an Bord: Wie man mit Apples Texterkennung arbeitetApples Texterkennung funktioniert gut – und kann sogar mehrseitige Dokumente übertragen. Wir zeigen, wie Entwickler sie nutzen.
Google I/O: Android 13 bietet mehr für Blinde und GehörloseBessere Braille-Unterstützung, Auswertung von Bilddateien, einen neuen Screenreader, personalisierte Geräuscherkennung und mehr zeigt Google auf der I/O.
Bild in Text umwandeln - so klappt'sSie haben ein PDF oder ein Bild, aus dem Sie den Text extrahieren möchten, ohne diesen abzutippen? Ein Tool erleichtert Ihnen die Arbeit.
Automatisierte Dateiverwaltung für macOS mit HazelViele Files landen unsortiert mit kryptischem Namen im Downloads-Ordner und sind schwer wiederzufinden. Statt manuell für Ordnung zu sorgen, helfen diese Tipps.
Barrierefreiheit: Gebärdende Avatare für Gehörlose in Websites integrierenFür viele Gehörlose ist Schriftsprache wie eine Fremdsprache. Gebärdende Avatare könnten ihnen helfen, Websites zu verstehen und sich schneller zu informieren.