0

Hallo, ich habe ein PDF und möchte dieses mit einem Kommandozeilenaufruf in Bilddateien umwandeln.

Dazu verwende ich DocTool mit folgendem Befehl "pdf24-DocTool.exe" -applyProfile -profile "user/pdf2jpg" -outputFile "test.jpg" "test.pdf" -noProgress

Anschließend mache ich mit tesseract eine OCR Erkennung...

Meine Einstellungen im Profil "pdf2jpg" sind Ausgabe als JPG, Grau (8-Bit), 100% Qualität und 300 DPI... Dasselbe PDF habe ich mit der PDF24 Toolbox "PDF in Bilder umwandeln" mit den Einstellungen JPG Grau 300 DPI Qualität 100 umgewandelt.

Bei den DocTools JPG Files funktioniert die OCR Erkennung (ich suche nach einem Ausdruck mit Regex) bei 3 von 5 Files. Bei den Toolbox generierten JPG Files funktioniert die OCR Erkennung bei 5 von 5 Files. Optisch sehe ich dass die JPG Datei aus der Toolbox geglättet wirkt,.. Weichgezeichnet und ca. 10% kleiner ist als die DocTool Variante.

Gibt es eine Möglichkeit die Umwandlung der Toolbox mittels Commandline anzustoßen?

Vielen Dank im Voraus!

claudiob Unselected an answer 2024-02-26