Hilfe: Text in PDF zu *.rtf wandeln ...

Schlagwörter: OCR "lesen", PDF wandeln, RTF-Datei als reine Text-Datei

Dieses Thema hat 4 Antworten und 2 Teilnehmer, und wurde zuletzt aktualisiert vor 1 Jahr, 3 Monaten von hewolk.

Ansicht von 5 Beiträgen - 1 bis 5 (von insgesamt 5)

Autor

Beiträge
2023-01-16 um 19:47 Uhr #16810

hewolk
Teilnehmer

Schönen Abend wünsch ich!

Ich habe ein Problem und geb' es langsam auf ...

Zwar hab' ich die Desktp-Version auf meinem Laptop, aber ich sitze im Moment an meinem Office-Rechner und da benutze ich die online-Toolbox. Leider komme ich damit nicht zurecht. 🙁

Mein Problem: Ich habe ausgedruckte Dokumente, die ich als jpeg- Dateien gescannt habe.

Will ich sie in OCR lesen, erhalten ich ein PDF-Dokument. (Es sieht sogar so aus, als sei das Foto einfach in ein PDF-Dok gepackt! Allerdings sagt das Tool "### Wörter wurden erkannt".) Aber ... ich habe (noch immer keinen Text).

Wenn ich nun hergehe und dieses Ergebnis-PDF-Doc mit "PDF umwandeln in" (*.rtf-Datei), erhalte ich zwar eine RTF-Datei, doch sie hat keinen Inhalt (Ihre ziemlich kleine Größe lässt das schon vermuten!)

Das gleiche geschieht, wenn ich es mit "PDF-Converter" versuche.

Nebenbei: Ich habe eine Textanwendung, die fähig ist, PDF-Dateien einzulesen (und nur den Text zu extrahieren, "Ableword"), doch auch die findet nur eine leere Seite.

Wer kann mir sagen, wo mein Denkfehler oder Bedienungsfehler liegt? Oder:

Wie kann mir pdf24 helfen, den Text einer PDF-Datei (oder einer Jpeg-Datei) in eine TVA-Anwendung (zur weiteren Bearbeitung) zu bekommen?

Herzliches Dankeschön im Voraus jedem hilfs- und dienstbereiten Geist! Und alles Liebe,

Hewolk

2023-01-17 um 7:56 Uhr #16811

Stefan Ziegler
Administrator

OCR legt lediglich einen Text-Layer über die Seiten im PDF, damit man nach dem Text suchen kann. Die Bilder bleiben erhalten. Die Umwandlung in RTF würde maximal ein RTF mit einem eingebetteten Bild erzeugen.

2023-01-17 um 12:01 Uhr #16814

hewolk
Teilnehmer

Danke sehr; ja, so schaut es aus (hab ich, glaube ich, in der Anfrage angemerkt).

Verstehe ich die Antwort richtig, nämlich, dass PDF24 die mir vorliegende Aufgabe gar nicht lösen kann? (Nämlich: den Text in einer PDF-Datei "extrahieren" z.B. als Eingabe in eine TVA?

Danke schon mal im Vorhinein, und alles Liebe,

Hewolk

2023-01-17 um 12:06 Uhr #16816

Stefan Ziegler
Administrator

Per OCR kann man den Text erkennen lassen. Die Umwandlung dieser PDF nach TEXT sollte dann den Text als .txt Datei abspeichern, den man dann weiter verarbeiten kann.

2023-01-17 um 12:10 Uhr #16817

hewolk
Teilnehmer

Danke noch mals! Aha ... ich hatte bislang immer als .rtf abgespeichert , aber da war (anscheinend) nur das ursprüngliche Bild drin. Ich probier's jetzt als .txt und werde mich wieder melden bzw. bedanken, wenn's erledigt ist. Alles Liebe und schönen Tag!

Hewolk
Autor

Beiträge

Ansicht von 5 Beiträgen - 1 bis 5 (von insgesamt 5)

Du musst angemeldet sein, um auf dieses Thema antworten zu können.