PDF-Dokumente: copy/paste und Suchen-Funktion defekt

Startseite Foren PDF24 Creator Allgemeines PDF-Dokumente: copy/paste und Suchen-Funktion defekt

Ansicht von 12 Beiträgen – 1 bis 12 (von insgesamt 12)
  • Autor
    Beiträge
  • #667
    gsandsds
    Teilnehmer

    Bei mir tritt mit dem PDF24 Creator ständig ein seltsamer Fehler auf, den ich einfach nicht losbekomme. Eigentlich sind es zwei Fehler.

    1.) Wenn ich aus einem ODF-Dokument mit PDF24 eine PDF erstellen lasse, werden Autor und Titel zwar übernommen, aber jedesmal wenn Umlaute in den Begriffen auftauchen, gibt es Fehler. Der Text wird dann in Klammern ausgegeben und anstelle der Umlauge etwas in der Form wie "366" ausgegeben.

    2.) Lade ich die PDF in den PDF24 Editor, um den obigen Fehler zu korrigieren, kann ich zwar die Änderungen vornehmen, aber das führt dann zu folgenden Problemen: Erstens funktioniert die interne Textsuche nicht mehr, bei keinem PDF-Viewer mehr. Man kann eine PDF also nicht mehr nach Schlagworten durchsuchen. Das Problem wird wohl seine Ursache im zweiten Problem haben: Copy/paste ich eine Textstelle, beispielsweise in Notepad rein, dann erscheint nur Zeichenmüll. Der Text sieht dann in etwas so aus:

    !#B)&BB
    !#DB&B;$0$<-&7B"
    '1'&BE8BEB

    (Wobei das der Browser vielleicht noch etwas anders anzeigen könnte als Notepad.)

    Das zweite Problem geschieht wohlgemerkt nur, wenn die PDF einmal im PDF24 Editor geladen und nochmal neu abgespeichert wurde. Soweit ich sehen kann, wird die PDF selbst noch korrekt angezeigt und auch gedruckt.

    Zur besseren Veranschaulichung hier ein Download mit den beiden Fehlerbeispielen:

    rpg-atelier.net/temp/PDF-Fehler.zip

    Die erste Datei in der Zip zeigt das Beispiel mit den kaputten Umlauten (hier beim Autor), die zweite Datei zeigt den nicht mehr durchsuchbaren und nicht mehr copy/paste-baren Text.

    #2022
    pdf24
    Teilnehmer

    Ok, ich sehe mir das Probleme heure mal an. Vielen Dank für die Informationen.

    #2023
    pdf24
    Teilnehmer

    Hallo,

    ich stelle veröffentliche diese Woche noch eine neue Version mit der Nummer 2.9.1. In dieser Version sollte das Problem dann beseitigt sein.

    #3151
    growbigtrees
    Teilnehmer

    Hello,

    I see the same error as GSandSDS describes:
    take an existing PDF, open in acrobat reader, then you can copy and paste in notepad.
    But if you edit in pdf24, remove some pages, save it, and open the new pdf in Acrobat reader, than you can copy but the paste result is the same kind of garbage as in GSandSDS's post ...

    EXAMPLE:
    Original 1-page File: Copy and Paste works as expected: wikisend.com/download/385526/TEST HS 1 page (ORIGINAL).pdf
    The same file, opened en saved by PDF24: paste generates wrong characters: wikisend.com/download/996234/TEST HS 1 page (saved by PDF24).pdf

    * the files are available in WikiSend for 7 days= till 10 june 2015

    #16419
    knaller
    Teilnehmer

    Leider tritt das Problem teilweise immer noch auf (zB Windows 10 mit pdf24 V 9.2.2):

    Wenn ich zB vom Browser Edge aus eine Website mit pdf24 drucke, kann man aus den erzeugten pdf-Dateien den Text nicht kopieren, da man dabei nur den oben schon beschriebenen Zeichenmüll erhält (zB "6&#470&#7$+#4").

    Wenn ich die gleiche Internetseite mit dem PDF-Generator "Als PDF speichern" erzeuge, sind die Textzeichen OK.

    Wenn ich das gleiche mit Firefox mache, wird mit pdf24 alles in Grafik umgewandelt und außer in der von pdf24 erzeugten Kopfzeile  sind keine Textzeichen mehr vorhanden.  Mit dem Drucker "Als PDF speichern" sind beim Firefox auch die Textzeichen OK.

    Das ganze habe ich gerade getestet mit dieser Webseite hier (https://help.pdf24.org/de/foren/thema/pdf-dokumente-copy-paste-und-suchen-funktion-defekt/). Außerdem tritt beim Edge noch das Problem auf, dass diese Internetseite hier nur teilweise gedruckt wird.

    #16433
    knaller
    Teilnehmer

    Was muss man denn tun, damit das Problem hier bearbeitet wird?

    #16451
    fischefr
    Teilnehmer

    Wir verwenden die Anwendung im Unternehmen. Zwischenzeitlich habe ich das Problem, dass Texte per Copy-And-Paste nicht aus PDFs entnommen werden können, wenn das PDF über Edge+PDF24 erzeugt wurde, mehrfach gemeldet bekommen. Leider kann ich immer nur sagen "Wir haben leider keine Lösung!"

    #16741
    Dennis Bezold
    Teilnehmer

    @knaller und @fischefr

    Schaut mal hier rein. Unter "Cause" seht ihr den Grund warum ihr diese Hieroglyphen angezeigt bekommt.

    https://www.tracker-software.com/knowledgebase/358-Why-cant-I-print-PDF-documents-correctly-from-Modern-Web-Browsers

    Tracker Software hat extra ein Plugin für alle möglichen Browser geschrieben. Mal sehen ob es auch etwas ähnliches für PDF24 geben wird.

    #16750
    fischefr
    Teilnehmer

    Interessante Info! Dann bräuchten wir also auch ein PDF24-Edge-AddIn.

    Alternativ wäre es evtl. eine Option, beim Druck zum PDFPrinter die OCR-Erkennung automatisch laufen zu lassen.

    #16753
    Dennis Bezold
    Teilnehmer

    Ich habe schon eine Frage erstellt.

    Drucken von Webseiten: Keine Suche oder kopieren möglich

    OCR im Nachgang wäre möglich, habe ich gerade getestet. Kommt natürlich auf die Größe an. Bei uns in der Firma sind 500 Seiten keine Seltenheit. Da dauert das einfach zu lange. Wir stellen darauf um, einfach "Als PDF speichern" zu verwenden.

    Dann funktioniert alles.

    #16758
    Stefan Ziegler
    Administrator

    Die Option "Als PDF speichern" ist aktuell die Beste Option, denn Chrome basierte Browser senden aktuell keine Zeichendaten über die Druckerschnittstelle, sodass wir nachträglich kein Text kopieren können. Bisher gibt es dazu noch keine Lösung seitens der Chrome basierte Browser.

    #17227
    timon
    Teilnehmer

    Dem Fehler mit der Texterkennung kann ich mich nur anschließen, und die Option "Als PDF speichern" ist leider keine geeignete Lösung für uns. Bei uns ist der Ablauf so, dass wir Rechnungen über eine webbasierte Software drucken. PDF24 legt das Dokument in einen freigegebenen Ordner ab und druckt automatisch weiter auf einen physischen Drucker, damit die Rechnung dem Kunden mitgegeben werden kann. Im Hintergrund wird der freigegebene Ordner überwacht, um die Rechnung automatisch in unser DMS-System abzulegen. Durch diesen Fehler kann das DMS-System die Dokumente nicht mehr automatisch ablegen, da nur Zeichenmüll ausgelesen werden kann.

    Unsere bisherige Lösung ist ein Chrome Add-in, das auf pdf.js basiert. Dort funktioniert es reibungslos, bis auf den Mangel, dass das Dokument sehr unscharf ist.

    Es liegt anscheinend aber nicht am PDF24 drucker, sondern an Chrome. Ich habe schon bestimmt 10 andere PDF-Drucker getestet und verschiedenste Browser. Das einzige wo es bisher funktioniert hat ist in Firefox, aber da hat leider die webbasierte Software diverse andere Probleme.

    Vielleicht hat noch jemand diese Probleme? Mir ist es zum ersten mal Ende Juli, Anfang August aufgefallen.

Ansicht von 12 Beiträgen – 1 bis 12 (von insgesamt 12)
  • Du musst angemeldet sein, um auf dieses Thema antworten zu können.