Startseite › Foren › PDF24 Creator › Allgemeines › OCR via CLI endet in Tesseract "shell"
Schlagwörter: OCR
- Dieses Thema hat 8 Antworten und 4 Teilnehmer, und wurde zuletzt aktualisiert vor 2 Jahren, 4 Monaten von user0815.
-
AutorBeiträge
-
2020-11-21 um 17:51 Uhr #15782user0815Teilnehmer
Hallo,
wenn ich das OCR Command Line Interface gemäß der bereitgestellten Anleitung in cmd.exe aufrufe, endet der Prozess in der Shell/Prompt von Tesseract:
TESS> Tesseract Open Source OCR Engine v4.1.1 with Leptonica
--->
Dies macht es natürlich unmöglich, das CLI in eigene Batches/Skripte einzubetten.
Erwartetes Verhalten: "exit 0" - also Rückkehr zu Aufruferstelle (also z.B. zurück in die cmd.exe ) - falls Konvertierung nicht erfolgreich, dann mit einem Rückgabewert ≠ 0. 😉
Über einen zeitnahen Bugfix würde ich mich freuen.
Meine Installationsdetails: PDF24 Creator v10.0.2 64bit (windows 10 64bit)
Danke.
2020-11-23 um 7:56 Uhr #15783Stefan ZieglerAdministratorBitte als Beispiel hier angeben, wie Sie das OCR Tool aufrufen. Ich bin mir fast sicher, dass es nicht in einer Tesseract Shell endet. Dieses "--->" ist nun keine Tesseract Shell, sondern wird von PDF24 ausgegeben. Wenn man nun einfach Enter drückt, dann sieht man den normalen Prompt der Batch Shell. Zu diesem Zeitpunkt ist das pdf24-ocr.exe Tool schon terminiert.
2020-11-23 um 20:30 Uhr #15787user0815TeilnehmerHallo Herr Ziegler,
vielen Dank für die schnelle Rückmeldung. Der Aufruf sieht so aus:
c:\Users\user0815\Desktop>"c:\Program Files\PDF24\pdf24-Ocr.exe" -outputFile out.pdf in.pdf
Sie haben Recht, mit einem Enter erhalte ich die übliche Zeile "c:\Users\user0815\Desktop>" zurück. Bereits mit der Anzeige von "--->" kann ich ganz normal cmd.exe-Befehle aufrufen:
--->dir
Datenträger in Laufwerk C: ist System
[...]Es ist also genau wie Sie sagen, der Prozess ist bereits terminiert.
Danke.
Ich hab dann noch weitere Szenarien ausprobiert und folgende Anmerkungen:
1) Für Aufrufe mit PDFs, die aufgrund des Textinhalts übersprungen werden, ist die Anzeige noch etwas unklarer, da das Prozessende optisch kaum/nicht erkannt werden kann (mit Enter oder gleich einem dir-Kommando lässt sich aber zeigen, dass es so ist):
c:\Users\user0815\Desktop>"c:\Program Files\PDF24\pdf24-Ocr.exe" -outputFile out.pdf in_already-with-text.pdf
c:\Users\user0815\Desktop>================
"C:\Program Files\PDF24\tesseract\tesseract.exe" -v
----------------
dir
Datenträger in Laufwerk C: ist System
[...]2) Ruft man die CLI mit z.B. einer Eingabedatei auf, die nicht exisitert, wird kein Fehler geliefert, sondern die GUI gestartet.
c:\Users\user0815\Desktop>"c:\Program Files\PDF24\pdf24-Ocr.exe" -outputFile out.pdf in_does-not-exist.pdf
Es wäre schön, wenn dies stattdessen zu einem exit ≠ 0 und bestenfalls einer Fehlerausgabe führen würde.
Beste Grüße und vielen Dank für Ihren Einsatz.
2021-03-05 um 21:06 Uhr #15969tbegsrTeilnehmerHallo
Haben sie eine Lösung für das Problem gefunden
Freundliche Grüsse2021-03-09 um 9:10 Uhr #15981Stefan ZieglerAdministratorHallo, eine Lösung für welches Problem? Wie oben geschrieben wurde, trügt der Schein und wenn ---> ausgegeben wird, dann ist man wieder da, wo man gestartet ist und man kann weitere Befehle absenden.
2021-03-19 um 18:31 Uhr #16001tbegsrTeilnehmerGuten Tag Herr Ziegler
Ich möchte die Konvertierung im Hintergrund starten. Sobald die Datei fertig konvertiert ist, soll sie weiter verarbeitet werden. Da ich aber nicht erkennen wann die Konvertierung beendet ist, weiss das Tool nicht wann es den nächsten Step ausführen soll.
Aus diesem Grunde sollte das Tool ohne Enter beendet werden sobald es die OCR Verarbeitung beendet hat so wie es user0815 beschrieben hat
Freundliche Grüsse und besten Dank2021-03-20 um 9:29 Uhr #16004tbegsrTeilnehmerGuten Tag
Ich habe jetzt eine Lösung gefunden.
Wenn ich ein bat File erstelle und dann aus meiner Applikation dieses Bat file ausführe funktioniert es so wie es muss
Besten Dank2021-09-18 um 20:27 Uhr #16141haudegen07TeilnehmerHallo,
wenn ich über den Befehl oben PDF24 aufrufe öffnet sich bei mir nur das PDF24 Fenster mit allen Einstellungen. Wie kann ich das Programm über die Kommandozeile starten?
In meinem Fall will ich alle Dateien in einem Ordner erst sichern und dann umwandeln.
Hier das Skript:
@echo off
set "BACKUPString=backup"
set "AKTPFAD=%cd%"
set "BACKUPDIR=%AKTPFAD%\%BACKUPString%"
echo aktueller Ordner: %AKTPFAD%
echo Backup DIR: %BACKUPDIR%
mkdir %BACKUPDIR%
FOR %%i IN (*.pdf) DO (
echo Sicherung und OCR auf: %%i
xcopy "%%i" %BACKUPString%
"C:\Program Files (x86)\PDF24\pdf24-Ocr.exe" -outputFile "%%i" -language ger -dpi 300 "%%i"
pause
2021-12-04 um 10:05 Uhr #16232user0815TeilnehmerHallo @haudegen07,
hört sich nach einem Fehlerfall an, der in den Fallback des GUI-Starts zurückfällt (vgl. Punkt 2) in meiner Antwort #15787 ). Ist eine inplace operation auf der selben Datei "%%i" wirklich supported - bzw. ist sie nicht zum Schreiben gesperrt, bis alle Leseoperationen durch sind?
Grüße
-
AutorBeiträge
- Du musst angemeldet sein, um auf dieses Thema antworten zu können.