„Schema-validierte CAMT-/MT940-/PAIN-Parser, OCR-Fallback für gescannte PDFs, deterministisches Field Mapping, Audit-Nachweise auf SR 11-7-Niveau — jeder Transformationsschritt protokolliert und reproduzierbar.
01 — Problem
Corporate-Treasury-Teams erhalten Kontoauszüge in den Formaten CAMT, PAIN.001, MT940, OFX, CSV und als gescannte PDFs von Dutzenden Banken. Jedes Format bringt eigene Feldsemantik, eigene Kodierungen und eigene Mehrdeutigkeiten mit. Die meisten Teams bauen fragile bankenspezifische Parser von Hand und blockieren damit Echtzeit-Cashforecasting, Betrugserkennung und prüfungsfeste Abstimmung.
02 — Was ich gebaut habe
Ein Open-Source-Python-Toolkit, das jedes gängige Kontoauszugsformat in einen einzigen, normalisierten Transaktionsstrom überführt. Schema-validierte CAMT-/MT940-/PAIN-Parser, OCR-Fallback für gescannte PDFs, deterministisches Field Mapping und Audit-Nachweise auf SR 11-7-Niveau für jeden Transformationsschritt.
In Zahlen
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR-PDF
- Per-field
- Provenienz: Quellformat und Parser-Version pro Feld protokolliert
- BCBS 239
- Konform zur Risikodaten-Aggregation gemäß BCBS 239
- Apache-2.0 / MIT
- Frei nutzbar, forkbar, prüfbar
03 — Engineering-Strenge
Unterstützte Formate
CAMT (.052, .053, .054), MT940, OFX, CSV, gescannte PDFs (OCR)
Normalisierungsziel
Ein einziges, vereinheitlichtes Transaktions-Datensatzschema
Audit-Trail
Provenienz pro Feld — Quellformat und Parser-Version je Zeile protokolliert
Lizenz
Apache-2.0 / MIT
04 — Unabhängig verifiziert
- Behandelt im Artikel vom 14.06.2026: Von Kontoauszügen zu vereinheitlichter Transaktionsintelligenz
- Konzipiert zur Erfüllung der Anforderungen an die Risikodaten-Aggregation nach BCBS 239