„Parsere CAMT / MT940 / PAIN validate la schemă, alternativă OCR pentru PDF-urile scanate, mapare deterministă a câmpurilor, dovezi de audit la nivelul SR 11-7 — fiecare pas de transformare este înregistrat și reproductibil.
01 — Problemă
Echipele de trezorerie corporativă primesc extrase bancare în CAMT, PAIN.001, MT940, OFX, CSV și PDF-uri scanate de la zeci de bănci. Fiecare format aduce semantici de câmp, codificări și ambiguități diferite. Majoritatea echipelor construiesc manual parsere fragile, specifice fiecărei bănci, blocând prognoza de numerar în timp real, detectarea fraudelor și reconcilierea pregătită pentru audit.
02 — Ce am construit
Un set de instrumente Python open-source care unifică fiecare format obișnuit de extras bancar într-un flux unic, normalizat, de tranzacții. Parsere CAMT / MT940 / PAIN validate la schemă, alternativă OCR pentru PDF-urile scanate, mapare deterministă a câmpurilor și dovezi de audit la nivelul SR 11-7 pentru fiecare pas de transformare.
În cifre
- 6 formate
- CAMT (.052/.053/.054), MT940, OFX, CSV, PDF OCR
- Pe câmp
- Proveniență: formatul sursă și versiunea parserului înregistrate
- BCBS 239
- Aliniat la agregarea datelor de risc
- Apache-2.0 / MIT
- Liber de utilizat, de modificat, de auditat
03 — Rigoare inginerească
Formate acceptate
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF scanat (OCR)
Țintă de normalizare
Schemă unică, unificată, de înregistrare a tranzacțiilor
Pistă de audit
Proveniență pe câmp — formatul sursă și versiunea parserului înregistrate pentru fiecare rând
Licență
Apache-2.0 / MIT
04 — Verificat independent
- Prezentat în articolul din 14.06.2026: De la extrasele bancare la inteligența unificată a tranzacțiilor
- Proiectat pentru a îndeplini cerințele BCBS 239 de agregare a datelor de risc