Möglicherweise sind in diesen PDFs die Informationen nicht als Text enthalten, sondern als Bild.
Wenn du diese PDFs außerhalb von PP mit einen PDF-Reader oder im Browser öffnest, kannst du dann einzelne Buchstaben/Wörter markieren und kopieren?
Möglicherweise sind in diesen PDFs die Informationen nicht als Text enthalten, sondern als Bild.
Wenn du diese PDFs außerhalb von PP mit einen PDF-Reader oder im Browser öffnest, kannst du dann einzelne Buchstaben/Wörter markieren und kopieren?
danke für die Frage.
ja, das Markieren von Buchstaben geht.
Das Markieren von Worten geht auch. Es passiert aber manchmal dass einige Buchstaben der Wörter nicht mitmarkiert sind.
Bei jüngeren PDFs konnte ich immer das ganze Wort ohne fehlende Buchstaben markieren.
Habe auch schon die PDF Sicherheitseinstellungen der alten mit den neuen PDFs verglichen - sind exakt gleich.
Ich habe nach Unterschieden zwischen den PDF Dateien von der HypoVereinsbank
Einziger Unterschied, den ich gefunden habe war, dass die im PDF verwendeten Schiften in den älteren, nicht importierbaren PDF Dateien sogenannte Type 1-Schriften (auch als PostScript, PS1, T1, Adobe Type 1, Multiple Master, oder MM bekannt) sind.
Laut Adobe wird <Unterstützung für das Authoring mit Type 1-Schriften wid in Adobe-Applikationen nach dem Januar 2023 eingestellt>.
Adobe PDF Reader zeigt diese an als:
[Font] T1
Typ: Type 3
Kodierung: Benutzerdefiniert
Qriginalschrift: T1
Originalschrifttyp: Type 3
[Font] T2
Typ: Type 3
Kodierung: Benutzerdefiniert
Qriginalschrift: T2
Originalschrifttyp: Type 3
[Font] T3
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrifttyp: T3
Originalschrifttyp: Type 3
[Font] T4
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrift: T4
Qriginalschrifttyp: Type 3
[Font] T5
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrift: T5
Qriginalschrifttyp: Type 3
[Font] T6
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrift: T6
Qriginalschrifttyp: Type 3
Die in PP verwendete <PDFBox Version: 3.0.5> scheint damit nicht zurechtzukommen und bricht die Umwandlung der PDF in Text ab - und man kann die Buchungsdatei nicht importieren.
Ich weiß nicht wie aufwändig eine Anpassung in <PDFBox Version: 3.0.5> wäre.
Vielleicht geht es ja auch ohne Anpassung … weiß leider nicht wie.
Aber vielleicht hat das schon jemand vor mir lösen können. Wäre cool ![]()
Hab das Problem mit cmdline PDFBox nachstellen können.
Dort wird als “Warning; No Unicode mapping for …” angezeigt.
Ist bekannt und eine allgemeine Lösung in PDFBox scheint nicht möglich.