Buchungen aus PDF-Dateien importieren

Freundliches hallo

an alles ich habe bei der DKB Bank jetzt mehrere PDF Abrechnungen aufeinmal runter geladen in eine ZIP Datei und wollte diese gleichzeitig hinzufügen aber es kommt immer eine Fehlermeldung

Screenshot_12

vielleicht kann mir jemand helfen geht das nicht mehrere PDF Dateien auf einmal

ZIP Dateien entpacken und dann die einzelnen pdf’ s importieren.
Wär mein erster Rat.
Stefan

1 Like

Hallo,

ich verwende die aktuell PortfolioPerformance Version für Linux unter Fedora 35. Seit kurzem bekomme ich beim Import von PDF Dokumenten immer verschiedene Fehler und ich kann sie sehr zuverlässig reproduzieren. Ich glaube ich bekomme die Fehler seit dem vorletzten Update.

Hier sind die Logs. Ich hoffe das Problem kann schnell behoben werden oder zumindest ein Workaround gefunden werden.
pp.log (467.1 KB)

Danke für das tolle Programm!

Tom

@TWe
Deine verwendete Java Version ist zu hoch, PP ist auf die 11er und nicht die 18er ausgelegt.

Vielen Dank für die schnelle Hilfe. Nach einem “sudo dnf install java-11-openjdk” waren in der Tat die Fehler weg.

Ich habe ein bisschen mit dem Import herumgespielt. Mir ist folgendes Verhalten aufgefallen.
Wenn das Wertpapier noch nicht vorhanden ist, wird es angelegt (sehr gut). Wenn ich nun das Wertpapier auf “nicht importieren” setze (durchgestrichen), wird es trotzdem mitsamt den Buchungen importiert, wenn ich nicht jede einzelne zu importierende Buchung in Bezug auf dieses Wertpapier auch lösche.

Ich habe da (Luxus-)Probleme mit Übernahmen/Spin-offs/ISIN Änderungen, wenn ich wieder den gesamten Ordner importiere. Dann werden von Hand angepasste Buchungen reimportiert. Ich habe die PDFs bisher nicht so sauber geordnet in importiert/ noch nicht importiert.

Es wäre einfach unten die Wertpapiere zu löschen beim Bestätigen des Imports, wenn dann auch oben die Buchungen weg gingen. Oder wenn man den Import nach Spalten sortieren könnte durch klick auf den Spaltennamen, damit ich schnell z.B. ein paar nicht benötigte Firmen deselektieren kann. Vielleicht geht das auch schon und ich habe es nur nicht hinbekommen.

Oder kann man beim neuen Wertpapier (z.B. im Namen) irgendwie eine flag setzen, dass die alten Buchungen dahin gehen und dann als Duplikate erkannt werden?

Hm, ich hatte den Eindruck, dass mir PDFs, die schon mal importiert wurden, bei einem erneuten Importversuch durchgestrichen dargestellt wurden und ich es manuell aktiv stellen musste, wenn ich das trotzdem nochmal haben wollte. Da der Dateiname der PDF ja Teil der anderen Buchung ist (Quelle), ist das ja auch keine Zauberei und ich hatte anerkennend genickt :wink:

Mir würde als Lösung einfallen, dass man die identifizierenden Merkmale aus dem alten Papier rauswirft, also ISIN, WKN und Symbol. Dann wird beim Import das alte Wertpapier nicht mehr gefunden.

über die Quelle ist die Duplikaterkennung aber nicht implementiert. Vergleichen der Spalte Quelle wäre eine gut Sache. Ich habe definitiv bei den alten Buchungen noch unter Quelle den PDF-Namen drin. Wegen Übernahmen etc. habe ich die Buchungen auf das neue Wertpapier umgebucht, aber die Buchung aus dem PDF wird nicht als Duplikat erkannt. Wegen splits hat sich aber auch die Anzahl geändert. Lediglich die Summe in Geldeinheiten bleibt gleich. Vermutlich checkt der Importer nach Datum/Anzahl/Summe. Ich weiß es nicht genau.
Die einzige Lösung die ich jetzt sehe, wäre die Ordnerstruktur auf dem PC an PP anzupassen. Vielleicht kennt ihr bessere Möglichkeiten?

das alte Wertpapier habe ich in PP gelöscht. Kommt beim Import aber wieder neu rein. Ich habe eben alle Kauf PDFs in einem einzigen Ordner. Ist ja auch keine große Sache. Muss man dann nur immer dran denken nur die neuen PDFs zu importieren und die danach abzulegen. Der Importer wurde auch verbessert über die Zeit und deshalb habe ich die ganzen alten PDFs auch wieder reingegeben. Wenn ich erst einmal alles drin habe, erübrigt sich das Problem dann auch.
Wobei ich das mapping über die Spalte Quelle als eindeutige ID für eine gute Idee halte.

Kann dich natürlich beißen, wenn dein Broker keine eindeutige Dateinamen verwendet. Bei der DAB war das damals z.B. pro Wertpapier so. Das könnte dann durchaus an anderer Stelle zu unerwartetem Verhalten führen.

das stimmt. Müsste brokerspezifisch sein. Ich habe noch nicht so ganz raus, wie der Import abläuft. Nur, dass es auf apache pdfbox basiert und in JAVA programmiert ist.

Java und PDFBox war jetzt aber auch nicht wirklich schwer zu erraten, oder? :wink:

Von den Fehlermeldungen her, die einem PP so abliefert, wenn beim Lesen was schiefgeht, lässt Reguläre Ausdrücke vermuten, d.h. du hast eine Liste von solchen und wenn alle auf den extrahierten Text zutreffen, weiss man, dass es sich z.B. um einen Wertpapierkauf handelt und wo genau sich dann die notwendigen Angaben für eine Buchung befinden.

Das wäre zumindest mein Lösungsansatz und weil es meiner ist, muss es auch der richtige sein :wink:

Bitte zunächst zur Kenntnis: Ich finde es super geil, dass es das Import-Feature gibt. Es funktioniert auch ziemlich gut für alle Konten/Depots, die ich habe.

Wovon ich träume: Dass man ein Konto/Depot als “Gemeinschaftskonto” definieren kann, sodass alles, was man dort hinein importiert einfach durch 2 geteilt wird (um den eigenen Anteil zu ermitteln). Natürlich alles bis auf den Aktienkurs. :slight_smile: . Aber Gebühren, Steuern, Stückzahlen, usw müsste alles halbiert werden.

Daher will ich dies hiermit als Verbesserungsvorschlag anbringen :slight_smile: - vielleicht ist es ja nicht so komplex zu implementieren und jemand hätte mal Lust drauf :smiley:

Hallo,

wenn man unter Windows im Auswahlfenster (PDF Import Assistent) die Suchfunktion nutzt, wird bei allen PDFs der Fehler “invalid file path” angezeigt.

Aber wohl nur, wenn sie in verschiedenen (Unter-)Ordnern liegen.

A post was merged into an existing topic: PDF-Import von ING

A post was merged into an existing topic: PDF-Import von Trade Republic

2 posts were merged into an existing topic: PDF-Import von Comdirect

Hallo,
das Programm ist einfach klasse.
Als Newcomer stolpere ich nun doch über die Importfunktion von pdf Bankdokumenten.
Egal ob von DB oder Trade Republic, ich bekomme nur Fehlermeldungen zu den Dokumenten.“Keinunterstütztes Dokument”
Mache ich etwas grundsätzlich verkehrt?
Vielen Dank vorab
Grüße Norbert

Hallo Norbert,

das ist seltsam! Kannst du ggf. in dem Dialog schauen, was die genaue Fehlermeldung ist? Bei der Zeile zu der entsprechenden Bank gibt es ggf. mehr Informationen, wie z.B. hier bei einem Dokument zu Scalable Capital: Die Bank wurde erkannt, aber der Typ der Buchung wird nicht unterstützt.

Welche PDF-Dokumente versuchst du denn zu Importieren? Also jeweils welche Bank, und wie heisst das PDF Dokument (z.B. Kauf/Verkauf etc.). Falls du versuchst zip-Dateien zu importieren, bitte vorher entpacken und die PDFs importieren statt das zip.

Zum Schluss kannst du unter “Importieren” noch “Debug: Text aus PDF extrahieren” auswählen, die Daten anonymisieren, und hier teilen, damit der Import ggf. verbessert/repariert werden kann.

Viele Grüsse
Alex

3 Likes

PDF Bulk Download - Linkclump / Tutorial @ArnulfKoch (Finanzkoch )