«Parser CAMT / MT940 / PAIN convalidati a schema, fallback OCR per i PDF scansionati, mappatura deterministica dei campi, evidenze di audit conformi a SR 11-7 — ogni passaggio di trasformazione è registrato e riproducibile.»
01 — Problema
I team di tesoreria aziendale ricevono rendiconti bancari in CAMT, PAIN.001, MT940, OFX, CSV e PDF scansionati da decine di banche. Ogni formato porta semantiche di campo, codifiche e ambiguità differenti. La maggior parte dei team costruisce a mano parser fragili e specifici per banca, bloccando la previsione di cassa in tempo reale, il rilevamento delle frodi e la riconciliazione conforme agli audit.
02 — Cosa ho costruito
Un toolkit Python open source che unifica ogni formato comune di rendiconto bancario in un singolo flusso di transazioni normalizzato. Parser CAMT / MT940 / PAIN convalidati a schema, fallback OCR per i PDF scansionati, mappatura deterministica dei campi ed evidenze di audit conformi a SR 11-7 per ogni passaggio di trasformazione.
In cifre
- 6 formati
- CAMT (.052/.053/.054), MT940, OFX, CSV, PDF OCR
- Per campo
- Provenienza: formato sorgente e versione del parser registrati
- BCBS 239
- Allineato all'aggregazione dei dati di rischio
- Apache-2.0 / MIT
- Liberamente utilizzabile, modificabile, verificabile
03 — Rigore ingegneristico
Formati supportati
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF scansionato (OCR)
Obiettivo di normalizzazione
Singolo schema unificato di record di transazione
Pista di audit
Provenienza per campo — formato sorgente e versione del parser registrati per ogni riga
Licenza
Apache-2.0 / MIT
04 — Verificato in modo indipendente
- Presentato nell'articolo del 14/06/2026: Dai rendiconti bancari all'intelligenza unificata delle transazioni
- Progettato per soddisfare i requisiti di aggregazione dei dati di rischio BCBS 239