Şema doğrulamalı CAMT / MT940 / PAIN ayrıştırıcıları, taranmış PDF'ler için OCR yedeği, deterministik alan eşlemesi ve SR 11-7 seviyesinde denetim kanıtı — her dönüşüm adımı kayıt altında ve yeniden üretilebilir.
01 — Problem
Kurumsal hazine ekipleri onlarca bankadan CAMT, PAIN.001, MT940, OFX, CSV ve taranmış PDF biçiminde banka ekstresi alır. Her formatın alan anlamları, kodlamaları ve belirsizlikleri farklıdır. Çoğu ekip bankaya özgü kırılgan ayrıştırıcıları elle inşa eder; bu da gerçek zamanlı nakit tahmini, dolandırıcılık tespiti ve denetime hazır mutabakatı engeller.
02 — Ne inşa ettim
Her yaygın banka ekstresi formatını tek bir normalize edilmiş işlem akışında birleştiren açık kaynaklı bir Python araç takımı. Şema doğrulamalı CAMT / MT940 / PAIN ayrıştırıcıları, taranmış PDF'ler için OCR yedeği, deterministik alan eşlemesi ve her dönüşüm adımı için SR 11-7 seviyesinde denetim kanıtı.
Rakamlarla
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- Köken: kaynak format ve ayrıştırıcı sürümü kayıt altında
- BCBS 239
- BCBS 239 risk verisi toplama ile uyumlu
- Apache-2.0 / MIT
- Serbest kullanım, çatallama ve denetim
03 — Mühendislik titizliği
Desteklenen formatlar
CAMT (.052, .053, .054), MT940, OFX, CSV, taranmış PDF (OCR)
Normalizasyon hedefi
Tek birleşik işlem kaydı şeması
Denetim izi
Alan bazında köken — her satıra kaynak format ve ayrıştırıcı sürümü işleniyor
Lisans
Apache-2.0 / MIT
04 — Bağımsız doğrulandı
- 2026-06-14 tarihli makalede yer aldı: Banka Ekstresinden Birleşik İşlem Zekâsına
- BCBS 239 risk verisi toplama gereksinimlerini karşılayacak şekilde tasarlandı