Parser CAMT / MT940 / PAIN tervalidasi skema, fallback OCR untuk PDF hasil pindai, pemetaan kolom deterministik, bukti audit setara SR 11-7 — setiap langkah transformasi tercatat dan dapat direproduksi.
01 — Masalah
Tim treasury korporat menerima rekening koran dalam format CAMT, PAIN.001, MT940, OFX, CSV, dan PDF hasil pindai dari puluhan bank. Setiap format membawa semantik kolom, encoding, dan ambiguitas yang berbeda. Sebagian besar tim membangun parser per-bank yang rapuh secara manual, menghambat peramalan kas real-time, deteksi fraud, dan rekonsiliasi siap audit.
02 — Apa yang saya bangun
Toolkit Python sumber terbuka yang menyatukan setiap format rekening koran bank yang umum menjadi satu aliran transaksi yang dinormalisasi. Parser CAMT / MT940 / PAIN tervalidasi skema, fallback OCR untuk PDF hasil pindai, pemetaan kolom deterministik, dan bukti audit setara SR 11-7 untuk setiap langkah transformasi.
Dalam angka
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- Provenans: format sumber + versi parser tercatat
- BCBS 239
- Selaras dengan agregasi data risiko
- Apache-2.0 / MIT
- Bebas digunakan, di-fork, diaudit
03 — Ketelitian rekayasa
Format yang didukung
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF hasil pindai (OCR)
Target normalisasi
Skema catatan transaksi tunggal yang terpadu
Jejak audit
Provenans per kolom — format sumber + versi parser tercatat per baris
Lisensi
Apache-2.0 / MIT
04 — Diverifikasi secara independen
- Ditampilkan dalam artikel 14-06-2026: Dari Rekening Koran ke Intelijen Transaksi Terpadu
- Dirancang untuk memenuhi persyaratan agregasi data risiko BCBS 239