Buchungen aus PDF-Dateien importieren

Inhaltsverzeichnis


Buchungen aus PDF-Dateien importieren

Für eine korrekte Berechnung der historischen Performance benötigt Portfolio Performance die historischen Buchungen. Die kann man manuell erfassen, oder - für einige Broker - aus den PDF Dokumenten importieren. Typischerweise sind das die Dokumente, die man im Postfach seines Brokers herunterladen kann.

Die PDF Datei wird zunächst in Text umgewandelt. In diesem Text sucht PP nach Mustern um eine Buchung zu erstellen. Das funktioniert für einige Banken erstaunlich gut und stabil, bei anderen Banken geht durch kleine Änderungen im PDF der Import immer wieder mal kaputt. Nicht ohne Grund ist die Funktionalität als “experimentell” gekennzeichnet.

Importieren

Aufruf über das Menü DateiImportieren…PDF Bank Dokumente.

In dem anschliessenden Dialog werden die erkannten Buchungen aufgelistet. Per Kontextmenü kann man entscheiden eine Buchung nicht zu importieren.

Falls eine existierende Buchung die gleichen Werte (Datum, Betrag, Wertpapier, etc.) aufweist, wird die zu importierende Buchung durchgestrichen und per Default nicht importiert.

Themen für die unterstützten Broker (PDF)

Themen für die unterstützten Broker (CSV)

Und andere PDF Dokumente?

Andere Dokumente können im Source Code hinzufügen werden. Wer sich daran versuchen möchte, schaut sich z.B. den Importer für die Deutsche Bank an. Ansonsten kann ich - wenn Zeit und Muße vorhanden ist - auch Dokumente hinzufügen. Dazu braucht es den Text:

  • Im Menü “Datei” → “Importieren…” → “Debug: Text aus PDF extrahieren…” den Text aus der PDF Datei generieren
  • Gegebenenfalls private Informationen wie Namen, Anschrift oder genaue Buchungswerte ändern. Dabei aber unbedingt darauf achten, dass man keine neuen Zeilen, keine Zeilenümbrüche, oder Leerzeichen oder ähnliches einfügt.
  • Neuen Github Issue mit dem Text anlegen oder hier im Forum posten. Beim Posten bitte den Text in drei Backticks (```) einschließen, die alleine in einer Zeile stehen, so dass die Formatierung nicht verändert wird.

Tutorial zum Extrahieren von Text aus PDF

20 Likes

Mir fehlt noch die Info, welches Dokumente der z.B. comdirect ich verwenden soll, damit der Import klappt. :stuck_out_tongue_winking_eye:

Hallo :slight_smile:

mein Depot ist bei der ING-DiBa und ich gerne meine alte Buchungen mit einfließen lassen.
Verwende ich dafür den PDF Kontoauszug vom zugehörigen ING-DiBa Konto den man am Jahresende bekommt?
“Extra_Konto_KONTONUMMER_Kontoauszug_DATUM”

Dieser funktioniert bei mir nicht :frowning:
Danke!

Bei der comdirect sollten Wertpapierkauf, Wertpapierverkauf und Gutschrift fälliger Wertpapier-Erträge funktionieren.

Bei der ING-DiBa sollten Wertpapierabrechnung Kauf, Wertpapierabrechnung Verkauf und Ertragsgutschrift funktionieren.

Bei den PDF Dokumenten werden meist nicht die Kontoauszüge (viele Buchungen) sondern die einzelnen Buchungen importiert.

Hallo,

der Import meines ING-DiBa Depots via PDF funktioniert leider nicht.

Fehlermeldung:
Unbekannter oder nicht unterstützter Buchungstyp in Datei ‘Unbenannt.pdf’

java.lang.UnsupportedOperationException: Unbekannter oder nicht unterstützter Buchungstyp in Datei 'Unbenannt.pdf’
at name.abuchen.portfolio.datatransfer.pdf.AbstractPDFExtractor.extract(AbstractPDFExtractor.java:117)
at name.abuchen.portfolio.datatransfer.pdf.AbstractPDFExtractor.extract(AbstractPDFExtractor.java:77)
at name.abuchen.portfolio.datatransfer.pdf.INGDiBaExtractor.extract(INGDiBaExtractor.java:1)
at name.abuchen.portfolio.ui.wizards.datatransfer.ReviewExtractedItemsPage$10.run(ReviewExtractedItemsPage.java:502)
at org.eclipse.core.internal.jobs.Worker.run(Worker.java:55)

Auf Wunsch kann ich vertraulich ein PDF anbieten.

Beste Grüße

1 Like

Das kann schon mal passieren. Über die Funktion “Datei → Importieren → Debug: Text aus PDF extrahieren…” kannst Du eine Textversion des PDF generieren (und darin Namen und Adresse ändern) und mir an portfolio dot Performance dot help at gmail dot com schicken. Ich habe in den letzten Tagen schon an dem ING-DiBa Importer gearbeitet - mal sehen ob ich alle Fälle erwischt habe.

1 Like

Hallo zusammen,
den Ausschlag für die Arbeit am ING DiBa Importer habe ich wohl gegeben.
Nochmal Danke an AndreasB für die schnelle Anpassung. Die bei mir aufgetretenen Fehler bezüglich der Erfassung der Steuern sind behoben.

Beste Grüße
Christian

1 Like

Der Import von DAB-Abrechnungen funktioniert seit der Umstellung des Layouts auf BNP-Style nicht mehr.
Kann das bitte angepasst werden, so dass es wieder läuft?

Dazu brauche ich Beispiele - wie oben beschrieben über das Menü generieren, Text anonymisieren (Kontonummern etc.) und mir schicken.

Und dann? Das Beispiel habe ich dir am 09.03.2017 zukommen lassen, leider ist bisher nichts mehr passier.

Das sollte ab Version 0.27.0 jetzt wieder tun. Wenn es trotzdem noch Probleme gibt, dann brauche ich wieder ein Beispiel.

Hallo Andreas,

die Bank, welche hinter Flatex steht, war bisher die “biw AG”, welche sich jetzt in “FinTech Group Bank AG” umbenannt hat. Auch andere Anbieter wie z.B. Whitebox benutzen diesen Bank. Die erzeugten PDFs sehen identisch aus, nur leider kann man die Importfunktion in Portfolio Performance nicht nutzen, da in den Daten nach dem String “flatex” gesucht wird.

Wäre es möglich, das File FlatexPDFExtractor.java in biwPDFExtractor.java zu kopieren und dabei die allerletzte Zeile in “return “biw AG”” zu ändern, um die historischen PDFs von biw/flatex/Whitebox/etc. zu importieren

und

wäre es möglich, eine weitere Kopie desselben Files mit dem Namen fintechgroupbankPDFExtractor.java zu erzeugen und dabei die allerletzte Zeile in “return “FinTech Group Bank AG”” zu ändern, um die aktuellen PDFs von biw/flatex/Whitebox/etc. zu importieren?

Vielen Dank und gib Bescheid, falls Du weitere Informationen benötigst
Stephan

@Ragas hat den Flatex Importer insoweit schon angepasst, dass es nicht mehr nur “biw AG” sondern auch “FinTech Group Bank AG” unterstützt wird.

Wenn ich das richtig sehe, dann wird aber trotzdem noch nach dem Eintrag “flatex” gesucht. Das können wir natürlich ändern - und zur Identifikation sollten wir vielleicht nach “FinTech Group Bank” suchen (und für alte Dokumente auch nach “biw”).

Was meinst Du, @Ragas? Spontan hätte ich das so geändert:

diff --git a/name.abuchen.portfolio/src/name/abuchen/portfolio/datatransfer/pdf/FlatexPDFExtractor.java b/name.abuchen.portfolio/src/name/abuchen/portfolio/datatransfer/pdf/FlatexPDFExtractor.java
index 26e45a8..3b981b6 100644
--- a/name.abuchen.portfolio/src/name/abuchen/portfolio/datatransfer/pdf/FlatexPDFExtractor.java
+++ b/name.abuchen.portfolio/src/name/abuchen/portfolio/datatransfer/pdf/FlatexPDFExtractor.java
@@ -21,6 +21,9 @@ public class FlatexPDFExtractor extends AbstractPDFExtractor
     public FlatexPDFExtractor(Client client) throws IOException
     {
         super(client);
+        
+        addBankIdentifier("biw AG");
+        addBankIdentifier("FinTech Group Bank AG");
 
         addBuySellTransaction();
         addBuyTransaction();
@@ -834,6 +837,6 @@ public class FlatexPDFExtractor extends AbstractPDFExtractor
     @Override
     public String getLabel()
     {
-        return "flatex"; //$NON-NLS-1$
+        return "FinTech Group Bank AG (flatex)"; //$NON-NLS-1$
     }
 }

Würde ich auch so machen, aber wäre es dann nicht sinnig das PP Menü von “Importieren > Flatex” auf “Importieren > FinTech Group Bank AG (flatex)” zu korrigieren? Leider funzt bei mir der Eclipse Menü Builder nicht, sonst könnte ich den Pull auch fertig machen.

Der Import von Dividendenabrechnungen bei codiert funktioniert bei mir nun nicht mehr. “unbekannter oder nicht unterstützter Buchungstyp” - funktioniert bei anderen der Dividendenimport comdirect ?

Comdirect? Bitte hier entlang:

VORSCHLAG: neue Tastenkombination für Import PDF-Bankdokumente
beim Erfassen von Umsätzen fände ich es als alter MS-DOS-Freak gut - wenn man ein einzelnes Wertpapier markiert hat - dort mit rechtem Mausklick (statt der Tastenkombination STRG + D + i + P) definiert den PDF-Import aufrufen könnte.
Bei rechtem Mausklick wird als Tastenkombination bisher nur “Editieren” (mit Strg +E) angeboten.
Dort würde die Ergänzung m.E. Sinn machen (zB. mit Strg+I) und man spart noch einige Tastendrücke.
Ich fände diese Option sinnvoll, da der Import dann an der richtigen Stelle beim einzelnen WP zur Verfügung stehen würde.

Großes LOB: an Andreas - ein hervorragendes Programm, welches ich täglich nutze!
HINWEIS: die Kurse importiere ich derzeit über ONVISTA, werde die Möglichkeit mit Alpha Vantage verfolgen…

Hallo dorg2009,

seit der Einführung des Import Assistenten gibt es die Tastenkombination STRG+I, P und notfalls STRG+X. Damit wird überall eigentlich der Import von PDF Dokumenten auch für Fans der Tastatur möglich.

Gruß
Marco

Hallo Marco,
vielen Dank für deine schnelle Antwort.
Also Strg+X war mir noch nicht bekannt, da diese Kombination im Menu nicht erkennbar ist.
Dieser Weg klappt jetzt prima! Man lernt nie aus!
LG Rene

Na ja, Strg-X habe ich nicht dokumentiert weil ich das eigentlich nur kurze Zeit aktiv halten wollte - @Ragas und ich haben ja den Import umgebaut. Das war als Hintertürchen gedacht wenn die PDF Detection nicht sofort die richtige Bank findet.

@dorg2009 Warum funktioniert denn Strg-I,P bei Dir nicht? Also erst Steuerung I (wie Import) und dann ein P (wie PDF) drücken.