OCR via CLI endet in Tesseract "shell"

Startseite Foren PDF24 Creator Allgemeines OCR via CLI endet in Tesseract "shell"

Schlagwörter: 

Ansicht von 9 Beiträgen - 1 bis 9 (von insgesamt 9)
  • Autor
    Beiträge
  • #15782
    user0815
    Teilnehmer

    Hallo,

    wenn ich das OCR Command Line Interface gemäß der bereitgestellten Anleitung in cmd.exe aufrufe, endet der Prozess in der Shell/Prompt von Tesseract:

    TESS> Tesseract Open Source OCR Engine v4.1.1 with Leptonica

    --->

    Dies macht es natürlich unmöglich, das CLI in eigene Batches/Skripte einzubetten.

    Erwartetes Verhalten: "exit 0" - also Rückkehr zu Aufruferstelle (also z.B. zurück in die cmd.exe ) - falls Konvertierung nicht erfolgreich, dann mit einem Rückgabewert ≠ 0. 😉

    Über einen zeitnahen Bugfix würde ich mich freuen.

    Meine Installationsdetails: PDF24 Creator v10.0.2 64bit (windows 10 64bit)

    Danke.

    #15783
    Stefan Ziegler
    Administrator

    Bitte als Beispiel hier angeben, wie Sie das OCR Tool aufrufen. Ich bin mir fast sicher, dass es nicht in einer Tesseract Shell endet. Dieses "--->" ist nun keine Tesseract Shell, sondern wird von PDF24 ausgegeben. Wenn man nun einfach Enter drückt, dann sieht man den normalen Prompt der Batch Shell. Zu diesem Zeitpunkt ist das pdf24-ocr.exe Tool schon terminiert.

    #15787
    user0815
    Teilnehmer

    Hallo Herr Ziegler,

    vielen Dank für die schnelle Rückmeldung. Der Aufruf sieht so aus:

    c:\Users\user0815\Desktop>"c:\Program Files\PDF24\pdf24-Ocr.exe" -outputFile out.pdf in.pdf

    Sie haben Recht, mit einem Enter erhalte ich die übliche Zeile "c:\Users\user0815\Desktop>" zurück. Bereits mit der Anzeige von "--->" kann ich ganz normal cmd.exe-Befehle aufrufen:

    --->dir
     Datenträger in Laufwerk C: ist System
    [...]

    Es ist also genau wie Sie sagen, der Prozess ist bereits terminiert.

    Danke.

    Ich hab dann noch weitere Szenarien ausprobiert und folgende Anmerkungen:

    1) Für Aufrufe mit PDFs, die aufgrund des Textinhalts übersprungen werden, ist die Anzeige noch etwas unklarer, da das Prozessende optisch kaum/nicht erkannt werden kann (mit Enter oder gleich einem dir-Kommando lässt sich aber zeigen, dass es so ist):

    c:\Users\user0815\Desktop>"c:\Program Files\PDF24\pdf24-Ocr.exe" -outputFile out.pdf in_already-with-text.pdf

    c:\Users\user0815\Desktop>================
    "C:\Program Files\PDF24\tesseract\tesseract.exe" -v
    ----------------
    dir
     Datenträger in Laufwerk C: ist System
    [...]

    2) Ruft man die CLI mit z.B. einer Eingabedatei auf, die nicht exisitert, wird kein Fehler geliefert, sondern die GUI gestartet.

    c:\Users\user0815\Desktop>"c:\Program Files\PDF24\pdf24-Ocr.exe" -outputFile out.pdf in_does-not-exist.pdf

    Es wäre schön, wenn dies stattdessen zu einem exit ≠ 0 und bestenfalls einer Fehlerausgabe führen würde.

     

    Beste Grüße und vielen Dank für Ihren Einsatz.

    #15969
    tbegsr
    Teilnehmer

    Hallo
    Haben sie eine Lösung für das Problem gefunden
    Freundliche Grüsse

    #15981
    Stefan Ziegler
    Administrator

    Hallo, eine Lösung für welches Problem? Wie oben geschrieben wurde,  trügt der Schein und wenn ---> ausgegeben wird, dann ist man wieder da, wo man gestartet ist und man kann weitere Befehle absenden.

    #16001
    tbegsr
    Teilnehmer

    Guten Tag Herr Ziegler
    Ich möchte die Konvertierung im Hintergrund starten. Sobald die Datei fertig konvertiert ist, soll sie weiter verarbeitet werden. Da ich aber nicht erkennen wann die Konvertierung beendet ist, weiss das Tool nicht wann es den nächsten Step ausführen soll.
    Aus diesem Grunde sollte das Tool ohne Enter beendet werden sobald es die OCR Verarbeitung beendet hat so wie es user0815 beschrieben hat
    Freundliche Grüsse und besten Dank

    #16004
    tbegsr
    Teilnehmer

    Guten Tag
    Ich habe jetzt eine Lösung gefunden.
    Wenn ich ein bat File erstelle und dann aus meiner Applikation dieses Bat file ausführe funktioniert es so wie es muss
    Besten Dank

    #16141
    haudegen07
    Teilnehmer

    Hallo,

    wenn ich über den Befehl oben PDF24 aufrufe öffnet sich bei mir nur das PDF24 Fenster mit allen Einstellungen. Wie kann ich das Programm über die Kommandozeile starten?

    In meinem Fall will ich alle Dateien in einem Ordner erst sichern und dann umwandeln.

    Hier  das Skript:

     

    @echo off

    set "BACKUPString=backup"

    set "AKTPFAD=%cd%"

    set "BACKUPDIR=%AKTPFAD%\%BACKUPString%"

    echo aktueller Ordner: %AKTPFAD%

    echo Backup DIR: %BACKUPDIR%

    mkdir %BACKUPDIR%

     

    FOR %%i IN (*.pdf) DO (

    echo Sicherung und OCR auf: %%i

    xcopy "%%i" %BACKUPString%

    "C:\Program Files (x86)\PDF24\pdf24-Ocr.exe" -outputFile "%%i" -language ger -dpi 300 "%%i"

    pause

    #16232
    user0815
    Teilnehmer

    Hallo @haudegen07,

    hört sich nach einem Fehlerfall an, der in den Fallback des GUI-Starts zurückfällt (vgl. Punkt 2) in meiner Antwort #15787 ). Ist eine inplace operation auf der selben Datei "%%i" wirklich supported - bzw. ist sie nicht zum Schreiben gesperrt, bis alle Leseoperationen durch sind?

    Grüße

Ansicht von 9 Beiträgen - 1 bis 9 (von insgesamt 9)
  • Du musst angemeldet sein, um auf dieses Thema antworten zu können.