Sehr geehrte Forum,
ich würde gerne PDF24 OCR ohne Internetverbindung nutzen wollen.
Hierzu habe ich mir folgenden Artikel angesehen:
Leider erhalte ich auf Clients ohne Internetverbindung dann weiterhin die Fehlermeldung „Aktualisierung der Sprachinformationen fehlgeschlagen."
Folgendes habe ich umgesetzt:
In der Registry folgenden Wert gesetzt:
HKEY_LOCAL_MACHINE\SOFTWARE\PDF24 ocr.language = deu (RegSz)
In das Verzeichnis „C:\Program Files\PDF24\tesseract\tessdata“ habe ich die Dateien „deu.traineddata“, „eng.traineddata“ und „local-list.txt“ kopiert, die ich von
https://github.com/tesseract-ocr/tessdata_fast/raw/4.0.0/eng.traineddata
https://github.com/tesseract-ocr/tessdata_fast/raw/4.0.0/deu.traineddata
https://creator.pdf24.org/tesseract/4.0/traindata/local-list.txt
heruntergeladen habe.
Wo liegt mein Fehler?
Gruß
Jan
Die local-list.txt herunterladen und in den Ordner "INSTALL_DIR/tesseract/" packen. Die Datei muss man noch umbenennen und zwar muss der Name trainDataList.txt sein.