מפענחי CAMT / MT940 / PAIN מאומתי-סכמה, גיבוי OCR ל-PDF סרוקים, מיפוי שדות דטרמיניסטי, ראיות ביקורת ברמת SR 11-7 — כל שלב טרנספורמציה מתועד וניתן לשחזור.
01 — בעיה
צוותי גזברות תאגידית מקבלים דפי בנק בפורמטים CAMT, PAIN.001, MT940, OFX, CSV ו-PDF סרוקים מעשרות בנקים. כל פורמט נושא סמנטיקת שדות, קידודים ועמימויות שונות. רוב הצוותים בונים ידנית מפענחים שבירים לכל בנק, וחוסמים בכך תחזית מזומנים בזמן אמת, זיהוי הונאות והתאמה מוכנה לביקורת.
02 — מה שבניתי
ערכת כלים פתוחה ב-Python המאחדת כל פורמט דף בנק נפוץ לזרם עסקאות אחד מנורמל. מפענחי CAMT / MT940 / PAIN מאומתי-סכמה, גיבוי OCR ל-PDF סרוקים, מיפוי שדות דטרמיניסטי וראיות ביקורת ברמת SR 11-7 לכל שלב טרנספורמציה.
במספרים
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- מקור: פורמט מקור וגרסת מפענח מתועדים
- BCBS 239
- מיושר ל-BCBS 239 לאגירת נתוני סיכון
- Apache-2.0 / MIT
- חופשי לשימוש, פיצול וביקורת
03 — קפדנות הנדסית
פורמטים נתמכים
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF סרוק (OCR)
יעד נורמליזציה
סכמת רשומת עסקאות מאוחדת אחת
מסלול ביקורת
מקור לכל שדה — פורמט מקור וגרסת מפענח מתועדים לכל שורה
רישיון
Apache-2.0 / MIT
04 — אומת באופן עצמאי
- הופיע במאמר מתאריך 2026-06-14: מדפי בנק למודיעין עסקאות מאוחד
- תוכנן לעמוד בדרישות אגירת נתוני סיכון של BCBS 239