OCR Chinese-Simpl. schlägt fehl

Question

287 views2026-02-03PDF24 Creator

0

fir99 7 2026-02-03 0 Comments

Hallo,

ich habe PDF24 Creator Version 11.29.1 installiert und alles funktioniert problemlos, bis ich jetzt OCR für chinesischen Text machen wollte. Es erfolgt die Fehlermeldung:

Could not open data file chi_sim_vert.traineddata. Try resetting!

Das Rücksetzen der OCR-Engine und das Löschen des Verzeichnisses "%LOCALAPPDATA%\PDF24\tesseract" hat an der Fehlermeldung nichts geändert.

Soll ich die Datei trainDataList.txt an forum@pdf24.org senden?

fir99 Answered question 2026-02-03

2 Answers

You are viewing 1 out of 2 answers, click here to view all answers.

score 0 · Answer 1 · 2026-02-03T14:53:51+00:00

Vielen Dank für den Hinweis. Eine etwas kleinere Reparatur habe ich umgesetzt, indem ich die vier chinesischen Daten-Dateien (chi_sim.traineddata usw.) heruntergeladen habe. Damit ist die Texterkennung zum erfolgreichen Abschluss gekommen.

Es gibt jetzt allerdings ein weiteres Problem: Wenn ich die Texterkennung über die originale PDF-Datei laufen lasse und die Ergebnis-Datei öffne, enthält diese keinen Text mehr, nur einige Striche vom originalen Layout.

Ein Workaround funktioniert jedoch: Wenn ich die Seiten als JPG-Dateien speichere und anschließend die Texterkennung darüber laufen lasse. Die Ergebnis-Datei enthält das Bild der Seite und den erkannten Text.