Hallo hhkvie
Hallo Stefan
Ich bin auch gerade viel mit PDF-OCR am arbeiten. Bei mir geht es nicht um Massen, sondern um "Grösse" Dokumente (ca. 100 Dokumente zwischen 33MB - 370MB).
Die gleichen „Unschönheiten“, wie es hhkvie schon beschrieben hat, sind mir auch aufgefallen und ich kann mich anschiessen. Bei mir kommt aber nun noch ein Problem dazu. Wenn man mehrere grössere Dateien einliesst, und das Programm beim durchlauf aus irgendeinem Grund abstürzt, lässt es die zuvor kopieren Dateien im Temp Ordner liegen. Bei mir sind so ca. 30GB Temp Dateien zusammengekommen.
Ist es möglich, dass beim nächsten Start des Programmes der Temp Ordern „aufgeräumt“ wird?
Weiter möchte ich nochmals anmerken, dass die OCR Funktion unbedingt in die DocTools kommen. So könnte evtl. auch hhkvie die ganze Sache etwas automatisieren über einen Batch.
DocTool und OCR
Sonnige Grüsse aus der Schweiz