Hilfe: Text in PDF zu *.rtf wandeln ...

Startseite Foren PDF24 Creator Allgemeines Hilfe: Text in PDF zu *.rtf wandeln ...

Ansicht von 5 Beiträgen - 1 bis 5 (von insgesamt 5)
  • Autor
    Beiträge
  • #16810
    hewolk
    Teilnehmer

    Schönen Abend wünsch ich!

    Ich habe ein Problem und geb' es langsam auf ...

    Zwar hab' ich die Desktp-Version auf meinem Laptop, aber ich sitze im Moment an meinem Office-Rechner und da benutze ich die online-Toolbox. Leider komme ich damit nicht zurecht. 🙁

    Mein Problem: Ich habe ausgedruckte Dokumente, die ich als jpeg- Dateien gescannt habe.

    Will ich sie in OCR lesen, erhalten ich ein PDF-Dokument. (Es sieht sogar so aus, als sei das Foto einfach in ein PDF-Dok gepackt! Allerdings sagt das Tool "### Wörter wurden erkannt".) Aber ... ich habe (noch immer keinen Text).

    Wenn ich nun hergehe und dieses Ergebnis-PDF-Doc mit "PDF umwandeln in" (*.rtf-Datei), erhalte ich zwar eine RTF-Datei, doch sie hat keinen Inhalt (Ihre ziemlich kleine Größe lässt das schon vermuten!)

    Das gleiche geschieht, wenn ich es mit "PDF-Converter" versuche.

    Nebenbei: Ich habe eine Textanwendung, die fähig ist, PDF-Dateien einzulesen (und nur den Text zu extrahieren, "Ableword"), doch auch die findet nur eine leere Seite.

    Wer kann mir sagen, wo mein Denkfehler oder Bedienungsfehler liegt? Oder:

    Wie kann mir pdf24 helfen, den Text einer PDF-Datei (oder einer Jpeg-Datei) in eine TVA-Anwendung (zur weiteren Bearbeitung) zu bekommen?

    Herzliches Dankeschön im Voraus jedem hilfs- und dienstbereiten Geist! Und alles Liebe,

    Hewolk

     

     

    #16811
    Stefan Ziegler
    Administrator

    OCR legt lediglich einen Text-Layer über die Seiten im PDF, damit man nach dem Text suchen kann. Die Bilder bleiben erhalten. Die Umwandlung in RTF würde maximal ein RTF mit einem eingebetteten Bild erzeugen.

    #16814
    hewolk
    Teilnehmer

    Danke sehr; ja, so schaut es aus (hab ich, glaube ich, in der Anfrage angemerkt).

    Verstehe ich die Antwort richtig, nämlich, dass PDF24 die mir vorliegende Aufgabe gar nicht lösen kann? (Nämlich: den Text in einer PDF-Datei "extrahieren" z.B. als Eingabe in eine TVA?

    Danke schon mal im Vorhinein, und alles Liebe,

    Hewolk

    #16816
    Stefan Ziegler
    Administrator

    Per OCR kann man den Text erkennen lassen. Die Umwandlung dieser PDF nach TEXT sollte dann den Text als .txt Datei abspeichern, den man dann weiter verarbeiten kann.

    #16817
    hewolk
    Teilnehmer

    Danke noch mals! Aha ... ich hatte bislang immer als .rtf abgespeichert , aber da war (anscheinend) nur das ursprüngliche Bild drin. Ich probier's jetzt als .txt und werde mich wieder melden bzw. bedanken, wenn's erledigt ist. Alles Liebe und schönen Tag!

    Hewolk

     

Ansicht von 5 Beiträgen - 1 bis 5 (von insgesamt 5)
  • Du musst angemeldet sein, um auf dieses Thema antworten zu können.