ตัวแยกวิเคราะห์ CAMT / MT940 / PAIN ที่ตรวจสอบสคีมา ระบบสำรอง OCR สำหรับ PDF ที่สแกน การแมปฟิลด์แบบกำหนดได้ และหลักฐานการตรวจสอบระดับ SR 11-7 — ทุกขั้นตอนการแปลงข้อมูลถูกบันทึกและทำซ้ำได้
01 — ปัญหา
ทีมบริหารเงินขององค์กรได้รับใบแจ้งยอดธนาคารในรูปแบบ CAMT, PAIN.001, MT940, OFX, CSV และ PDF ที่สแกนจากธนาคารหลายสิบแห่ง แต่ละรูปแบบมี ความหมายของฟิลด์ การเข้ารหัส และความกำกวมที่แตกต่างกัน ทีมส่วนใหญ่ จึงสร้างตัวแยกวิเคราะห์เฉพาะธนาคารที่เปราะบางขึ้นมาเอง ซึ่งขัดขวาง การพยากรณ์กระแสเงินสดแบบเรียลไทม์ การตรวจจับการฉ้อโกง และการกระทบยอด ที่พร้อมตรวจสอบ
02 — สิ่งที่ฉันสร้าง
ชุดเครื่องมือ Python แบบโอเพนซอร์สที่รวมรูปแบบใบแจ้งยอดธนาคารทั่วไป ทุกแบบให้กลายเป็นกระแสธุรกรรมเดียวที่ปรับมาตรฐานแล้ว ประกอบด้วยตัวแยก วิเคราะห์ CAMT / MT940 / PAIN ที่ตรวจสอบสคีมา ระบบสำรอง OCR สำหรับ PDF ที่สแกน การแมปฟิลด์แบบกำหนดได้ และหลักฐานการตรวจสอบระดับ SR 11-7 สำหรับทุกขั้นตอนการแปลงข้อมูล
ในตัวเลข
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- ที่มาของข้อมูล: บันทึกรูปแบบต้นทาง + เวอร์ชันของตัวแยกวิเคราะห์
- BCBS 239
- สอดคล้องกับการรวบรวมข้อมูลความเสี่ยง
- Apache-2.0 / MIT
- ใช้ได้ฟรี ปรับแก้ได้ ตรวจสอบได้
03 — ความเข้มงวดทางวิศวกรรม
รูปแบบที่รองรับ
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF ที่สแกน (OCR)
เป้าหมายการปรับมาตรฐาน
สคีมาบันทึกธุรกรรมรวมแบบเดียว
ร่องรอยการตรวจสอบ
ที่มาของแต่ละฟิลด์ — บันทึกรูปแบบต้นทาง + เวอร์ชันตัวแยกวิเคราะห์ต่อแถว
ใบอนุญาต
Apache-2.0 / MIT
04 — ผ่านการตรวจสอบโดยอิสระ
- นำเสนอในบทความวันที่ 2026-06-14: From Bank Statements to Unified Transaction Intelligence
- ออกแบบเพื่อให้สอดคล้องกับข้อกำหนดการรวบรวมข้อมูลความเสี่ยง BCBS 239