Hallo.
Ich müsste zur Weiterverarbeitung und -Nutzung unterschiedliche PDF-Dateien (oder deren Einzelseiten) von z.B. A0, A1, A2, A3... nach DIN A4 ändern und zusätzlich manuell skalieren (also z.B. zwar von A3 nach A4, aber nur 30%).
Aus Schutzgründen darf dies NICHT ONLINE passieren, nur offline!
Aktuell fand ich nur den Weg über PDF-Drucker, aber egal wie, danach ist der Text je nach Quell-PDF teils nicht mehr als Text im PDF sondern scheinbar als Vektor/Grafik.
Mit einer Word-Test-Datei hat es funktioniert, aber nicht mit unseren Leitungsplänen.
In den Original-Dateien kann nach Text gesucht werden, nicht aber in daraus wiederum erstellten / in Datei gedruckten PDFs.
Es muss 100% sichergestellt sein, dass der Text original bleibt, also keinesfalls nachträglich OCR.
Stelle ich mich zu blöd an, ist es zu viel verlangt?
Vielen Dank.
Fall es die Entwickler hier interessiert:
Die schweizer »Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen« hat ebenfalls mit dem Problem zu tun und behandelt es in einem Report mit dem Titel: »PDF mit mangelhaftem Font: Text ist nicht durchsuch- und extrahierbar«. Das PDF de Reports verlinke ich hier:
https://kost-ceco.ch/cms/dl/bc72d52d6e97d8e375c2cf4e1d18a497/KOST_PPEG_PDF-Font_Report_v1.pdf