Stapel OCR

Startseite Foren PDF24 Creator Allgemeines Stapel OCR

Schlagwörter: 

Ansicht von 3 Beiträgen - 1 bis 3 (von insgesamt 3)
  • Autor
    Beiträge
  • #15276
    hhkvie
    Teilnehmer

    Im Moment mache ich viel mit PDF-OCR. PDF24 kann das zwar ansatzweise, aber in der Praxis stören einige Punkte:

    • PDF24 kopiert die zu bearbeitenden PDFs immer erst in ein Arbeitsverzeichnis, (ich verstehe nicht warum) das dauert bei mehreren tausend PDFs Ewigkeiten.
    • Leider kann man die umgewandelten Dateien erst abspeichern, wenn PDF24 mit allem durch ist. Wenn das Programm abstürzt, oder der Rechner rumzickt, ist die Arbeit von Stunden weg. Es müsste also Datei für Datei in einem vorher zu wählenden Ordner gespeichert werden.
    • PDF24kann nicht mit passwortgeschützten Dateien umgehen, hierzu fehlt eine Option, diese zu überspringen, oder das Passwort einzugeben.
    #15350
    Stefan Ziegler
    Administrator
    • Das kopieren ist notwendig, denn hier wird gleichzeitig geschaut, ob die PDF geschützt ist und der Benutzer muss ein Passwort eingeben, wenn dies der Fall ist.
    • Die kommende Version kann Dateien nach Fertigstellung automatisch speichern
    •  PDF24 kann definitiv auch mit passwortgeschützten Dateien umgehen. Das Passwort wird abgefragt, wenn die PDF geladen wird und wenn die PDF wirklich geschützt sein sollte.
    #15354
    swiss_man
    Teilnehmer

    Hallo hhkvie
    Hallo Stefan

    Ich bin auch gerade viel mit PDF-OCR am arbeiten. Bei mir geht es nicht um Massen, sondern um "Grösse" Dokumente (ca. 100 Dokumente zwischen 33MB - 370MB).

    Die gleichen „Unschönheiten“, wie es hhkvie schon beschrieben hat, sind mir auch aufgefallen und ich kann mich anschiessen. Bei mir kommt aber nun noch ein Problem dazu. Wenn man mehrere grössere Dateien einliesst, und das Programm beim durchlauf aus irgendeinem Grund abstürzt, lässt es die zuvor kopieren Dateien im Temp Ordner liegen. Bei mir sind so ca. 30GB Temp Dateien zusammengekommen.

    Ist es möglich, dass beim nächsten Start des Programmes der Temp Ordern „aufgeräumt“ wird?

    Weiter möchte ich nochmals anmerken, dass die OCR Funktion unbedingt in die DocTools kommen. So könnte evtl. auch hhkvie die ganze Sache etwas automatisieren über einen Batch.

    DocTool und OCR

    Sonnige Grüsse aus der Schweiz

Ansicht von 3 Beiträgen - 1 bis 3 (von insgesamt 3)
  • Du musst angemeldet sein, um auf dieses Thema antworten zu können.