Parsery CAMT / MT940 / PAIN validované proti schématu, OCR záloha pro skenovaná PDF, deterministické mapování polí, auditní důkazy úrovně SR 11-7 — každý krok transformace zaznamenán a reprodukovatelný.
01 — Problém
Korporátní treasury týmy přijímají bankovní výpisy ve formátech CAMT, PAIN.001, MT940, OFX, CSV a jako skenovaná PDF od desítek bank. Každý formát nese odlišnou sémantiku polí, kódování a nejednoznačnosti. Většina týmů ručně staví křehké parsery pro každou banku zvlášť, což blokuje cash forecasting v reálném čase, detekci podvodů a auditně připravenou rekonciliaci.
02 — Co jsem postavil
Open-source Python sada, která sjednocuje každý běžný formát bankovního výpisu do jediného normalizovaného toku transakcí. Parsery CAMT / MT940 / PAIN validované proti schématu, OCR záloha pro skenovaná PDF, deterministické mapování polí a auditní důkazy úrovně SR 11-7 pro každý krok transformace.
V číslech
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- Sledování původu: zdrojový formát + verze parseru zaznamenány
- BCBS 239
- V souladu s agregací rizikových dat
- Apache-2.0 / MIT
- Volné k použití, forkování, auditu
03 — Inženýrská přísnost
Podporované formáty
CAMT (.052, .053, .054), MT940, OFX, CSV, skenované PDF (OCR)
Cíl normalizace
Jednotné sjednocené schéma záznamu transakce
Auditní stopa
Sledování původu na úrovni pole — zdrojový formát + verze parseru zaznamenány u každého řádku
Licence
Apache-2.0 / MIT
04 — Nezávisle ověřeno
- Představeno v článku z 14. 6. 2026: From Bank Statements to Unified Transaction Intelligence
- Navrženo tak, aby splňovalo požadavky BCBS 239 na agregaci rizikových dat