Hallo!
Nachdem ich die neue Texterkennungs-Möglichkeit in der aktuellsten Version gesehen habe, musste ich sie auch gleich ausprobieren.
Leider war das Ergebnis nicht so berauschend.
Ich scannte ein einfaches, kurzen Anschreiben, dass ich als eingescanntes Bild im PDF-Format gespeichert wurde. Das Anschreiben enthielt nur Text, keine Tabellen oder Bilder, dafür ein Adressfeld, einen Briefkopf ("Logo") und eben den Brieftext.
Das gespeicherte Ergebnis der OCR-Erkennung sah gut aus, allerdings wurde beim Versuch, den Brieftext zu markieren und zu kopieren, nicht der Brieftext als ganzes markiert. Dafür wurden viele, nicht dem Absatz zugehörige Wörter markiert, auch solche, die zur Anschrift oder dem Briefkopf gehörten. Andere Wörter des Absatzes verloren ihre Markierung.
Das herauskopierte Ergebnis was auch ein wildes durcheinander von Wörtern aus allen Teilen des gescannten Briefs. Bei unterschiedlichen Tests wurde die kopierten Bereiche auch doppelt eingefügt.
Die Funktion ist bei dem Ergebnis unbrauchbar.
Müssen die gescannten Dateien irgend welchen Formalien entsprechen, wenn die Bilder nach dem Scanvorgang als PDF-Dateien gespeichert werden?
Mit einem Bildformat (.jpg) habe ich die Texterkennung nicht getestet.
Grüße
Frank