Buchungen aus PDF-Dateien importieren

Hallo und Sorry das ich diesen Thread ein stückweit “Zweckentfremde”, ich wollte allerdings (erstmal) keinen neuen Thread eröffnen bis meine Frage geklärt ist und leider konnte ich @Nirus nicht privat anschreiben.

Meine Frage:
Nehmt ihr auch nicht deutschsprachige Banken/ Broker auf? Hätte da Fidelity aus den USA im Angebot.

Gruß

Hallo @anon19595724
Es ist egal woher die Bank oder Broker kommt.
Etwas Unterstützung von euch und er wird implementiert.

Gruß
Alex

1 Like

Hallo Allerseits
Verwalte mein selber geführtes Depot bei Swissquote mit PP. Nebenbei habe ich auch noch ein Depot bei inyova. Das ist ein Roboadvisor und ich habe nur indirekt Einfluss auf das Depot (Auswahl der Strategie und so).
Nun würde ich aber das Depot zu Vergleichszwecken trotzdem in PP importieren.
Ich bin selber zu wenig bewandert in Java um das mit vernünftigem Aufwand zu machen. Wenn das aber für jemanden keine grosse Sache wäre, könnte ich einen pdf-Export des jährlichen tax reports liefern.

Gruss

Stell ein anonymes PDF zur Verfügung, dann kann sich das jemand angucken. Enthält das PDF Daten zu Käufen, Verkäufen, usw. mit Stückanzahl, Datum, Kurs?

Wie das geht sieht man im folgenden Videotutorial:

PDF-Dokumente für die Fehlersuche extrahieren

Grüße

2 Likes

Ich nutze seit einigen Jahren den PDF-Import für meine Abrechnungen und bin echt begeistert, da dies einiges an Zeit erspart.
Jedoch ist mir vor einengen Monat aufgefallen, dass der Dateiname der PDF unter „Quelle“ nicht mehr gelöscht werden kann.
Früher war der PDF-Name glaube ich immer unter „Hinweise“ sichtbar und wurde direkt von mir entfernt, da diese Information für mich keinen Mehrwert darstellt und die Abrechnungen sowieso in einer separaten Ordnerstruktur zu Dokumentationszwecken abgespeichert werden.
Dies hängt vermutlich mit einem Update zusammen.
Man kann zwar den Dateinamen in der XML Datei per Windows Editor manuell entfernen aber das manuelle löschen des Eintrags birgt doch auf Dauer einige Risiken .
Könnte man bitte mit einem künftigen Update die Funktion wieder zurück bringen oder es ermöglichen, dass der Dateiname nicht hinterlegt wird?

Freundliches hallo

an alles ich habe bei der DKB Bank jetzt mehrere PDF Abrechnungen aufeinmal runter geladen in eine ZIP Datei und wollte diese gleichzeitig hinzufügen aber es kommt immer eine Fehlermeldung

Screenshot_12

vielleicht kann mir jemand helfen geht das nicht mehrere PDF Dateien auf einmal

ZIP Dateien entpacken und dann die einzelnen pdf’ s importieren.
Wär mein erster Rat.
Stefan

1 Like

Hallo,

ich verwende die aktuell PortfolioPerformance Version für Linux unter Fedora 35. Seit kurzem bekomme ich beim Import von PDF Dokumenten immer verschiedene Fehler und ich kann sie sehr zuverlässig reproduzieren. Ich glaube ich bekomme die Fehler seit dem vorletzten Update.

Hier sind die Logs. Ich hoffe das Problem kann schnell behoben werden oder zumindest ein Workaround gefunden werden.
pp.log (467.1 KB)

Danke für das tolle Programm!

Tom

@TWe
Deine verwendete Java Version ist zu hoch, PP ist auf die 11er und nicht die 18er ausgelegt.

Vielen Dank für die schnelle Hilfe. Nach einem “sudo dnf install java-11-openjdk” waren in der Tat die Fehler weg.

Ich habe ein bisschen mit dem Import herumgespielt. Mir ist folgendes Verhalten aufgefallen.
Wenn das Wertpapier noch nicht vorhanden ist, wird es angelegt (sehr gut). Wenn ich nun das Wertpapier auf “nicht importieren” setze (durchgestrichen), wird es trotzdem mitsamt den Buchungen importiert, wenn ich nicht jede einzelne zu importierende Buchung in Bezug auf dieses Wertpapier auch lösche.

Ich habe da (Luxus-)Probleme mit Übernahmen/Spin-offs/ISIN Änderungen, wenn ich wieder den gesamten Ordner importiere. Dann werden von Hand angepasste Buchungen reimportiert. Ich habe die PDFs bisher nicht so sauber geordnet in importiert/ noch nicht importiert.

Es wäre einfach unten die Wertpapiere zu löschen beim Bestätigen des Imports, wenn dann auch oben die Buchungen weg gingen. Oder wenn man den Import nach Spalten sortieren könnte durch klick auf den Spaltennamen, damit ich schnell z.B. ein paar nicht benötigte Firmen deselektieren kann. Vielleicht geht das auch schon und ich habe es nur nicht hinbekommen.

Oder kann man beim neuen Wertpapier (z.B. im Namen) irgendwie eine flag setzen, dass die alten Buchungen dahin gehen und dann als Duplikate erkannt werden?

Hm, ich hatte den Eindruck, dass mir PDFs, die schon mal importiert wurden, bei einem erneuten Importversuch durchgestrichen dargestellt wurden und ich es manuell aktiv stellen musste, wenn ich das trotzdem nochmal haben wollte. Da der Dateiname der PDF ja Teil der anderen Buchung ist (Quelle), ist das ja auch keine Zauberei und ich hatte anerkennend genickt :wink:

Mir würde als Lösung einfallen, dass man die identifizierenden Merkmale aus dem alten Papier rauswirft, also ISIN, WKN und Symbol. Dann wird beim Import das alte Wertpapier nicht mehr gefunden.

über die Quelle ist die Duplikaterkennung aber nicht implementiert. Vergleichen der Spalte Quelle wäre eine gut Sache. Ich habe definitiv bei den alten Buchungen noch unter Quelle den PDF-Namen drin. Wegen Übernahmen etc. habe ich die Buchungen auf das neue Wertpapier umgebucht, aber die Buchung aus dem PDF wird nicht als Duplikat erkannt. Wegen splits hat sich aber auch die Anzahl geändert. Lediglich die Summe in Geldeinheiten bleibt gleich. Vermutlich checkt der Importer nach Datum/Anzahl/Summe. Ich weiß es nicht genau.
Die einzige Lösung die ich jetzt sehe, wäre die Ordnerstruktur auf dem PC an PP anzupassen. Vielleicht kennt ihr bessere Möglichkeiten?

das alte Wertpapier habe ich in PP gelöscht. Kommt beim Import aber wieder neu rein. Ich habe eben alle Kauf PDFs in einem einzigen Ordner. Ist ja auch keine große Sache. Muss man dann nur immer dran denken nur die neuen PDFs zu importieren und die danach abzulegen. Der Importer wurde auch verbessert über die Zeit und deshalb habe ich die ganzen alten PDFs auch wieder reingegeben. Wenn ich erst einmal alles drin habe, erübrigt sich das Problem dann auch.
Wobei ich das mapping über die Spalte Quelle als eindeutige ID für eine gute Idee halte.

Kann dich natürlich beißen, wenn dein Broker keine eindeutige Dateinamen verwendet. Bei der DAB war das damals z.B. pro Wertpapier so. Das könnte dann durchaus an anderer Stelle zu unerwartetem Verhalten führen.

das stimmt. Müsste brokerspezifisch sein. Ich habe noch nicht so ganz raus, wie der Import abläuft. Nur, dass es auf apache pdfbox basiert und in JAVA programmiert ist.

Java und PDFBox war jetzt aber auch nicht wirklich schwer zu erraten, oder? :wink:

Von den Fehlermeldungen her, die einem PP so abliefert, wenn beim Lesen was schiefgeht, lässt Reguläre Ausdrücke vermuten, d.h. du hast eine Liste von solchen und wenn alle auf den extrahierten Text zutreffen, weiss man, dass es sich z.B. um einen Wertpapierkauf handelt und wo genau sich dann die notwendigen Angaben für eine Buchung befinden.

Das wäre zumindest mein Lösungsansatz und weil es meiner ist, muss es auch der richtige sein :wink:

Bitte zunächst zur Kenntnis: Ich finde es super geil, dass es das Import-Feature gibt. Es funktioniert auch ziemlich gut für alle Konten/Depots, die ich habe.

Wovon ich träume: Dass man ein Konto/Depot als “Gemeinschaftskonto” definieren kann, sodass alles, was man dort hinein importiert einfach durch 2 geteilt wird (um den eigenen Anteil zu ermitteln). Natürlich alles bis auf den Aktienkurs. :slight_smile: . Aber Gebühren, Steuern, Stückzahlen, usw müsste alles halbiert werden.

Daher will ich dies hiermit als Verbesserungsvorschlag anbringen :slight_smile: - vielleicht ist es ja nicht so komplex zu implementieren und jemand hätte mal Lust drauf :smiley:

Hallo,

wenn man unter Windows im Auswahlfenster (PDF Import Assistent) die Suchfunktion nutzt, wird bei allen PDFs der Fehler “invalid file path” angezeigt.

Aber wohl nur, wenn sie in verschiedenen (Unter-)Ordnern liegen.

A post was merged into an existing topic: PDF-Import von ING