Buchungen aus PDF-Dateien importieren

Hm, ich hatte den Eindruck, dass mir PDFs, die schon mal importiert wurden, bei einem erneuten Importversuch durchgestrichen dargestellt wurden und ich es manuell aktiv stellen musste, wenn ich das trotzdem nochmal haben wollte. Da der Dateiname der PDF ja Teil der anderen Buchung ist (Quelle), ist das ja auch keine Zauberei und ich hatte anerkennend genickt :wink:

Mir würde als Lösung einfallen, dass man die identifizierenden Merkmale aus dem alten Papier rauswirft, also ISIN, WKN und Symbol. Dann wird beim Import das alte Wertpapier nicht mehr gefunden.

über die Quelle ist die Duplikaterkennung aber nicht implementiert. Vergleichen der Spalte Quelle wäre eine gut Sache. Ich habe definitiv bei den alten Buchungen noch unter Quelle den PDF-Namen drin. Wegen Übernahmen etc. habe ich die Buchungen auf das neue Wertpapier umgebucht, aber die Buchung aus dem PDF wird nicht als Duplikat erkannt. Wegen splits hat sich aber auch die Anzahl geändert. Lediglich die Summe in Geldeinheiten bleibt gleich. Vermutlich checkt der Importer nach Datum/Anzahl/Summe. Ich weiß es nicht genau.
Die einzige Lösung die ich jetzt sehe, wäre die Ordnerstruktur auf dem PC an PP anzupassen. Vielleicht kennt ihr bessere Möglichkeiten?

das alte Wertpapier habe ich in PP gelöscht. Kommt beim Import aber wieder neu rein. Ich habe eben alle Kauf PDFs in einem einzigen Ordner. Ist ja auch keine große Sache. Muss man dann nur immer dran denken nur die neuen PDFs zu importieren und die danach abzulegen. Der Importer wurde auch verbessert über die Zeit und deshalb habe ich die ganzen alten PDFs auch wieder reingegeben. Wenn ich erst einmal alles drin habe, erübrigt sich das Problem dann auch.
Wobei ich das mapping über die Spalte Quelle als eindeutige ID für eine gute Idee halte.

Kann dich natürlich beißen, wenn dein Broker keine eindeutige Dateinamen verwendet. Bei der DAB war das damals z.B. pro Wertpapier so. Das könnte dann durchaus an anderer Stelle zu unerwartetem Verhalten führen.

das stimmt. Müsste brokerspezifisch sein. Ich habe noch nicht so ganz raus, wie der Import abläuft. Nur, dass es auf apache pdfbox basiert und in JAVA programmiert ist.

Java und PDFBox war jetzt aber auch nicht wirklich schwer zu erraten, oder? :wink:

Von den Fehlermeldungen her, die einem PP so abliefert, wenn beim Lesen was schiefgeht, lässt Reguläre Ausdrücke vermuten, d.h. du hast eine Liste von solchen und wenn alle auf den extrahierten Text zutreffen, weiss man, dass es sich z.B. um einen Wertpapierkauf handelt und wo genau sich dann die notwendigen Angaben für eine Buchung befinden.

Das wäre zumindest mein Lösungsansatz und weil es meiner ist, muss es auch der richtige sein :wink:

Bitte zunächst zur Kenntnis: Ich finde es super geil, dass es das Import-Feature gibt. Es funktioniert auch ziemlich gut für alle Konten/Depots, die ich habe.

Wovon ich träume: Dass man ein Konto/Depot als “Gemeinschaftskonto” definieren kann, sodass alles, was man dort hinein importiert einfach durch 2 geteilt wird (um den eigenen Anteil zu ermitteln). Natürlich alles bis auf den Aktienkurs. :slight_smile: . Aber Gebühren, Steuern, Stückzahlen, usw müsste alles halbiert werden.

Daher will ich dies hiermit als Verbesserungsvorschlag anbringen :slight_smile: - vielleicht ist es ja nicht so komplex zu implementieren und jemand hätte mal Lust drauf :smiley:

Hallo,

wenn man unter Windows im Auswahlfenster (PDF Import Assistent) die Suchfunktion nutzt, wird bei allen PDFs der Fehler “invalid file path” angezeigt.

Aber wohl nur, wenn sie in verschiedenen (Unter-)Ordnern liegen.

A post was merged into an existing topic: PDF-Import von ING

A post was merged into an existing topic: PDF-Import von Trade Republic

2 posts were merged into an existing topic: PDF-Import von Comdirect

Hallo,
das Programm ist einfach klasse.
Als Newcomer stolpere ich nun doch über die Importfunktion von pdf Bankdokumenten.
Egal ob von DB oder Trade Republic, ich bekomme nur Fehlermeldungen zu den Dokumenten.“Keinunterstütztes Dokument”
Mache ich etwas grundsätzlich verkehrt?
Vielen Dank vorab
Grüße Norbert

Hallo Norbert,

das ist seltsam! Kannst du ggf. in dem Dialog schauen, was die genaue Fehlermeldung ist? Bei der Zeile zu der entsprechenden Bank gibt es ggf. mehr Informationen, wie z.B. hier bei einem Dokument zu Scalable Capital: Die Bank wurde erkannt, aber der Typ der Buchung wird nicht unterstützt.

Welche PDF-Dokumente versuchst du denn zu Importieren? Also jeweils welche Bank, und wie heisst das PDF Dokument (z.B. Kauf/Verkauf etc.). Falls du versuchst zip-Dateien zu importieren, bitte vorher entpacken und die PDFs importieren statt das zip.

Zum Schluss kannst du unter “Importieren” noch “Debug: Text aus PDF extrahieren” auswählen, die Daten anonymisieren, und hier teilen, damit der Import ggf. verbessert/repariert werden kann.

Viele Grüsse
Alex

3 Likes

PDF Bulk Download - Linkclump / Tutorial @ArnulfKoch (Finanzkoch )