Parsery CAMT / MT940 / PAIN walidowane względem schematu, awaryjna ścieżka OCR dla skanowanych PDF, deterministyczne mapowanie pól oraz dowody audytowe klasy SR 11-7 — każdy krok transformacji zapisany i odtwarzalny.
01 — Problem
Zespoły skarbu korporacyjnego otrzymują wyciągi bankowe w formatach CAMT, PAIN.001, MT940, OFX, CSV oraz jako skanowane PDF z dziesiątek banków. Każdy format niesie inną semantykę pól, kodowanie i niejednoznaczności. Większość zespołów buduje ręcznie kruche parsery per bank, co blokuje prognozowanie gotówki w czasie rzeczywistym, wykrywanie nadużyć i uzgodnienia gotowe do audytu.
02 — Co zbudowałem
Otwartoźródłowy zestaw narzędzi w Pythonie, który ujednolica każdy popularny format wyciągu bankowego w jednolity, znormalizowany strumień transakcji. Parsery CAMT / MT940 / PAIN walidowane względem schematu, awaryjna ścieżka OCR dla skanowanych PDF, deterministyczne mapowanie pól oraz dowody audytowe klasy SR 11-7 dla każdego kroku transformacji.
W liczbach
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- Proweniencja: format źródłowy i wersja parsera rejestrowane
- BCBS 239
- Zgodne z agregacją danych ryzyka BCBS 239
- Apache-2.0 / MIT
- Wolne do użytku, forkowania i audytu
03 — Rygor inżynierski
Obsługiwane formaty
CAMT (.052, .053, .054), MT940, OFX, CSV, skanowany PDF (OCR)
Cel normalizacji
Jednolity schemat rekordu transakcji
Ślad audytowy
Proweniencja per pole — format źródłowy i wersja parsera rejestrowane na każdy wiersz
Licencja
Apache-2.0 / MIT
04 — Zweryfikowane niezależnie
- Opisane w artykule z 14.06.2026: From Bank Statements to Unified Transaction Intelligence
- Zaprojektowane tak, aby spełniać wymagania agregacji danych ryzyka BCBS 239