स्कीमा-सत्यापित CAMT / MT940 / PAIN पार्सर, स्कैन की गई PDF के लिए OCR फ़ॉलबैक, नियतात्मक फ़ील्ड मैपिंग, SR 11-7-स्तरीय ऑडिट प्रमाण — प्रत्येक रूपांतरण चरण दर्ज और पुनरुत्पादनीय।
01 — समस्या
कॉर्पोरेट ट्रेज़री टीमें दर्जनों बैंकों से CAMT, PAIN.001, MT940, OFX, CSV और स्कैन की गई PDF में बैंक स्टेटमेंट प्राप्त करती हैं। प्रत्येक प्रारूप में भिन्न फ़ील्ड शब्दार्थ, एन्कोडिंग और अस्पष्टताएँ होती हैं। अधिकांश टीमें प्रति-बैंक नाज़ुक पार्सर हाथ से बनाती हैं, जिससे वास्तविक-समय नकदी पूर्वानुमान, धोखाधड़ी का पता लगाना और ऑडिट-तैयार समाधान अवरुद्ध हो जाता है।
02 — मैंने जो बनाया
एक ओपन-सोर्स Python टूलकिट जो हर सामान्य बैंक स्टेटमेंट प्रारूप को एक ही, सामान्यीकृत लेनदेन धारा में एकीकृत करता है। स्कीमा-सत्यापित CAMT / MT940 / PAIN पार्सर, स्कैन की गई PDF के लिए OCR फ़ॉलबैक, नियतात्मक फ़ील्ड मैपिंग, और प्रत्येक रूपांतरण चरण के लिए SR 11-7-स्तरीय ऑडिट प्रमाण।
संख्या में
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- उद्गम-प्रमाण: स्रोत प्रारूप + पार्सर संस्करण लॉग किया गया
- BCBS 239
- जोखिम-डेटा एकत्रीकरण के अनुरूप
- Apache-2.0 / MIT
- उपयोग, फोर्क और ऑडिट के लिए निःशुल्क
03 — इंजीनियरिंग की कठोरता
समर्थित प्रारूप
CAMT (.052, .053, .054), MT940, OFX, CSV, स्कैन की गई PDF (OCR)
सामान्यीकरण लक्ष्य
एकल एकीकृत लेनदेन रिकॉर्ड स्कीमा
ऑडिट ट्रेल
प्रति-फ़ील्ड उद्गम-प्रमाण — प्रति पंक्ति स्रोत प्रारूप + पार्सर संस्करण लॉग किया गया
लाइसेंस
Apache-2.0 / MIT
04 — स्वतंत्र रूप से सत्यापित
- 2026-06-14 के लेख में प्रस्तुत: बैंक स्टेटमेंट से एकीकृत लेनदेन इंटेलिजेंस तक
- BCBS 239 जोखिम-डेटा एकत्रीकरण आवश्यकताओं को पूरा करने के लिए डिज़ाइन किया गया