PDF-Import von HypoVereinsbank/UniCredit Bank

J_A_E_R · October 30, 2025, 7:48pm

Möglicherweise sind in diesen PDFs die Informationen nicht als Text enthalten, sondern als Bild.

Wenn du diese PDFs außerhalb von PP mit einen PDF-Reader oder im Browser öffnest, kannst du dann einzelne Buchstaben/Wörter markieren und kopieren?

romau · October 30, 2025, 8:11pm

danke für die Frage.

ja, das Markieren von Buchstaben geht.

Das Markieren von Worten geht auch. Es passiert aber manchmal dass einige Buchstaben der Wörter nicht mitmarkiert sind.

Bei jüngeren PDFs konnte ich immer das ganze Wort ohne fehlende Buchstaben markieren.

Habe auch schon die PDF Sicherheitseinstellungen der alten mit den neuen PDFs verglichen - sind exakt gleich.

romau · November 2, 2025, 7:50pm

Ich habe nach Unterschieden zwischen den PDF Dateien von der HypoVereinsbank

die importiert werden können gegenüber denen
welche NICHT importiert werden können,
gesucht.

Einziger Unterschied, den ich gefunden habe war, dass die im PDF verwendeten Schiften in den älteren, nicht importierbaren PDF Dateien sogenannte Type 1-Schriften (auch als PostScript, PS1, T1, Adobe Type 1, Multiple Master, oder MM bekannt) sind.

Laut Adobe wird <Unterstützung für das Authoring mit Type 1-Schriften wid in Adobe-Applikationen nach dem Januar 2023 eingestellt>.

Adobe PDF Reader zeigt diese an als:

[Font] T1
Typ: Type 3
Kodierung: Benutzerdefiniert
Qriginalschrift: T1
Originalschrifttyp: Type 3

[Font] T2
Typ: Type 3
Kodierung: Benutzerdefiniert
Qriginalschrift: T2
Originalschrifttyp: Type 3

[Font] T3
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrifttyp: T3
Originalschrifttyp: Type 3

[Font] T4
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrift: T4
Qriginalschrifttyp: Type 3

[Font] T5
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrift: T5
Qriginalschrifttyp: Type 3

[Font] T6
Typ: Type 3
Kodierung: Benutzerdefiniert
Originalschrift: T6
Qriginalschrifttyp: Type 3

Die in PP verwendete <PDFBox Version: 3.0.5> scheint damit nicht zurechtzukommen und bricht die Umwandlung der PDF in Text ab - und man kann die Buchungsdatei nicht importieren.

Ich weiß nicht wie aufwändig eine Anpassung in <PDFBox Version: 3.0.5> wäre.
Vielleicht geht es ja auch ohne Anpassung … weiß leider nicht wie.

Aber vielleicht hat das schon jemand vor mir lösen können. Wäre cool

romau · November 3, 2025, 8:19pm

Hab das Problem mit cmdline PDFBox nachstellen können.

Dort wird als “Warning; No Unicode mapping for …” angezeigt.

Ist bekannt und eine allgemeine Lösung in PDFBox scheint nicht möglich.

Someone · January 27, 2026, 7:34am

Hallo zusammen,

anbei ein Debug zur Vorabpauschalen-Besteuerung der Hypovereinsbank - wäre toll, wenn diese Dokumentenart auch verarbeitet werden kann - bei Bedarf kann ich auch gerne weitere Dokumente zur Verfügung stellen.

Danke nochmals für dieses großartige Tool und Eure unermüdliche Verbesserungsarbeit.

Someone

Steuerinformationsbeleg_(226893843)_anonym.PDF.txt (9,6 KB)