Schema-gevalideerde CAMT-/MT940-/PAIN-parsers, OCR-terugval voor gescande PDF's, deterministische veldmapping en auditbewijs op SR 11-7-niveau — elke transformatiestap geregistreerd en reproduceerbaar.
01 — Probleem
Corporate-treasuryteams ontvangen bankafschriften in CAMT, PAIN.001, MT940, OFX, CSV en gescande PDF's van tientallen banken. Elk formaat hanteert andere veldsemantiek, codering en ambiguïteiten. De meeste teams bouwen handmatig broze parsers per bank, wat realtime kasprognoses, fraudedetectie en auditklare reconciliatie blokkeert.
02 — Wat ik heb gebouwd
Een open-source Python-toolkit die elk gangbaar bankafschriftformaat samenbrengt in één genormaliseerde transactiestroom. Schema-gevalideerde CAMT-/MT940-/PAIN-parsers, OCR-terugval voor gescande PDF's, deterministische veldmapping en auditbewijs op SR 11-7-niveau voor elke transformatiestap.
In cijfers
- 6 formaten
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR-PDF
- Per veld
- Herkomst: bronformaat + parserversie vastgelegd
- BCBS 239
- Afgestemd op aggregatie van risicogegevens
- Apache-2.0 / MIT
- Vrij te gebruiken, te forken en te auditen
03 — Engineering-precisie
Ondersteunde formaten
CAMT (.052, .053, .054), MT940, OFX, CSV, gescande PDF (OCR)
Normalisatiedoel
Eén uniform schema voor transactierecords
Audittrail
Herkomst per veld — bronformaat + parserversie per regel vastgelegd
Licentie
Apache-2.0 / MIT
04 — Onafhankelijk geverifieerd
- Behandeld in het artikel van 2026-06-14: From Bank Statements to Unified Transaction Intelligence
- Ontworpen om te voldoen aan de BCBS 239-eisen voor aggregatie van risicogegevens