Hallo,
wenn man mit der OCR eines Scans nicht zufrieden ist, gibt es derzeit keine Möglichkeit diese wieder zu löschen oder?
Führt man wiederholt die OCR aus (mit zwischenzeitlichem Speichern), und liest den erkannten Text mit einem Text-Extractor aus, steht der erkannte Text dann mehrfach drin, statt nur einmal.
Grüße
Joe
Ich will auch nochmal bestätigen, dass diese Funktion sehr wichtig ist. Ich gehe auf Nummer sicher und will immer alles nochmal neu ocren, wenn ich Dokumente erhalte. Weil die aber teilweise schon ocred sind, darf ich dann immer für jedes Suchergebnis doppelt auf "weiter" klicken beim Suchen. Bei Suchen mit vielen Ergebnissen sehr nervig.
Ideal wäre es natürlich, wenn ein Abgleich stattfünde und bei Abweichungen beide behalten werden. Aber so viel Aufwand muss man sich nicht machen. Einfach weg mit dem alten wäre super 🙂 Dankeschön!
"Dateien mit Text überspringen" macht kein OCR in Dateien, in denen Text enthalten ist.
"Seiten mit Text überspringen" macht kein OCR in Seiten, die Text enthalten.
Das Löschen von OCR erkanntem Text kann bisher noch nicht gelöscht werden. Ich habe den Punkt auf die TODO gesetzt.
Ich finde keine. Und kann dieses Verhalten bestätigen: doppelte OCR, doppelter Text hinterlegt.
In einer früheren Version (ich weiß leider nicht mehr bis zu welcher) war das anders: Wenn das OCR-Tool von PDF24 gearbeitet hat, wurde als erstes alter hinterlegter Text gelöscht.
Am schönsten wäre natürlich, wenn man das Verhalten steuern könnte.
Die Optionen "Dateien mit Text überspringen" und "Seiten mit Text überspringen" helfen da irgendwie gar nicht. Mir ist unklar, was die bewirken. Was heißt "überspringen"? Beim Erkennen überspringen? Beim Löschen früherer Texte überspringen?
Welcher Text ist da überhaupt gemeint? Angezeigter? Oder hinter der Grafik erkannter?
Hallo,
vielen Dank.
ist ungefähr absehbar wann der Punkt implementiert sein wird (Wochen/Monate/Jahre) ?
VG
Joe