Hallo.
Ich müsste zur Weiterverarbeitung und -Nutzung unterschiedliche PDF-Dateien (oder deren Einzelseiten) von z.B. A0, A1, A2, A3... nach DIN A4 ändern und zusätzlich manuell skalieren (also z.B. zwar von A3 nach A4, aber nur 30%).
Aus Schutzgründen darf dies NICHT ONLINE passieren, nur offline!
Aktuell fand ich nur den Weg über PDF-Drucker, aber egal wie, danach ist der Text je nach Quell-PDF teils nicht mehr als Text im PDF sondern scheinbar als Vektor/Grafik.
Mit einer Word-Test-Datei hat es funktioniert, aber nicht mit unseren Leitungsplänen.
In den Original-Dateien kann nach Text gesucht werden, nicht aber in daraus wiederum erstellten / in Datei gedruckten PDFs.
Es muss 100% sichergestellt sein, dass der Text original bleibt, also keinesfalls nachträglich OCR.
Stelle ich mich zu blöd an, ist es zu viel verlangt?
Vielen Dank.
Hallo,
wenn über den PDF Drucker gegangen wird, dann hängt es ganz start von der druckenden Anwendung ab, ob der Text danach durchsuchbar bleibt oder nicht. Nur wenige Anwendungen drucken ein PDF so, dass die Textinformationen nach dem Druck erhalten bleiben. Daher ist der Weg über den PDF Drucker nicht optimal.
Besser ist es, die Skalierung per Transformation vorzunehmen. Dies verändert den Inhalt der Datei nicht, sondern skaliert diesen lediglich.
Im PDF24 Creator, eine Anwendung für Windows, die lokal auf dem PC arbeitet und alle Dateien offline verarbeitet, enthält ein Tool, mit dem man die PDF-Seitengröße ändern kann. Das Tool im PDF24 Creator ist die offline Version von unserem entsprechenden online Tool, welche ich zuvor verlinkt habe.
Prüfen Sie bitte einmal, ob dieses Tool ihre Anforderungen erfüllt. Wenn nicht alles erfüllt ist, dann schildern Sie bitte, welche Funktion fehlt und senden Sie mir diese am besten an forum@pdf24.org. Gerne auch eine Testdatei beifügen, damit wir basierend auf dieser eine Lösungen für dieses Problem einarbeiten können.
Fall es die Entwickler hier interessiert:
Die schweizer »Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen« hat ebenfalls mit dem Problem zu tun und behandelt es in einem Report mit dem Titel: »PDF mit mangelhaftem Font: Text ist nicht durchsuch- und extrahierbar«. Das PDF de Reports verlinke ich hier:
https://kost-ceco.ch/cms/dl/bc72d52d6e97d8e375c2cf4e1d18a497/KOST_PPEG_PDF-Font_Report_v1.pdf
Leider musste ich auch gerade feststellen, dass sich manche mit PDF24 als PDF "gedruckte" Internetseiten nicht nach Text durchsuchen lassen. "Drucke" ich dieselbe Seite jedoch mit dem browsereigenen PDF-Drucktool (Firefox oder Brave) lässt sich das damit erstellte PDF nach Text durchsuchen. Mit Microsoft Print to PDF und auch mit PDF Creator lässt sich das PDF derselben Website hinterher aber ebenfalls nicht nach Text durchsuchen. Leider habe ich das alles erst bemerkt, nachdem ich auf den bezahlten Artikel bei test.de nun keinen Zugriff mehr habe und die Seiten demnach nicht erneut "drucken" kann.
Testen lässt sich das aber auch mit der Homepage von test.de. Ich dachte erst, dass das Problem mit allen Internetseiten besteht, die Bilder enthalten, aber dem ist laut meinen Versuchen nicht so. Die Ursache scheint eine andere zu sein.
Fazit: Internetseiten nur über das browsereigene Tool als PDF speichern. Mit allen anderen PDF-Drucktools besteht das Risiko, dass sich das damit erstellte PDF hinterher nicht durchsuchen lässt. Es wäre aber toll, wenn PDF24 das lösen könnte.
Offline können Sie dies mit dem PDF24 Creator machen. Dort die Toolbox öffnen und dann auf "Seitengröße ändern" klicken. Dort dann die PDF reinladen, A4 einstellen und die neue PDF erstellen.
Es ist zwar schon etwas her und ich habe es seit dem nicht mehr skalieren müssen (kommt alle paar Monate Mal bei mir vor), aber ich meine eine Lösung bzw. die Ursache gefunden zu haben...
Es liegt wohl an den Schriftarten!
Ich habe z.B. Quell-Dokumente, welche zwar EIGENTLICH alle Arial haben sollten, scheinbar sind aber andere Schriftarten in den Textfeldern enthalten oder was weiß ich.
Zumindest konnte ich es lösen, indem ich in den noch bearbeitbaren Text im PDF einfach alles markiere und Arial (in meinem Fall) einstelle.
Danach hat alles geklappt.
Vmtl. stecken in den Quelldokumenten irgendwelche obskuren Einstellungen was die Schriftart betrifft, mit dem PDF24 nicht umgehen kann.
Hallo und vielen Dank.
Also egal wie ich es anstelle, ich finde nichts von dem.
Im Creator alle Möglichkeiten nach "Toolbox" gesucht und nicht gefunden.
Evtl. liegt es an unserer Version 9.2.2 in der Firma (worauf ich keinen Einfluss habe).
Ich habe übrigens eine Möglichkeit (unabhängig der genutzten Software gefunden).
Es lag daran, dass wohl verschiedene Schriftarten im Quell-Dokument verwendet wurden und dies zu sonderbaren Zeichenumwandlungen führte.
In den PDF's wurde OPTISCH immer alles korrekt angezeigt, jedoch wenn ich den Text kopiert hatte, erhielt ich beim Wiedereinfügen (z.B. in Notepad++) nur rechteckige Kästchen.
Nun kam ich auf die Idee (da es aus Quelle Word funktionierte), dass ich ZUERST im Quell-Dokument alles auf Arial einstelle und dann mit dem Drucken, Skalieren etc. fortfahre.
Das half dann.
Blöd nur, dass man bei der Skalierung die Position der Objekte in Acrobat Std. nicht bestimmen kann und alles default oben links ausgerichtet ist. Ebenso Seitenränder lassen sich nicht einstellen (ausgegraut).
Auch das noch im Vorfeld oder auch danach positionieren der Objekte ist katastrophal und nur mit der Maus möglich.
Nicht einmal Gruppieren geht, so dass man alles z.B. zentriert ausrichten könnte.
Vmtl. erwarte ich von einem PDF-Tool (in dem Fall Acrobat Std.) viel zu viel, was man aus vielen Programmen (sogar Word) deutlich besser kennt.
...ich schweife ab.
Also finale liegt es wohl an unserer steinalten Version, was PDF24 angeht.
Vielen Dank trotzdem