«Парсери CAMT / MT940 / PAIN зі схемною валідацією, OCR-резерв для сканованих PDF, детерміноване зіставлення полів, аудиторські докази рівня SR 11-7 — кожен крок перетворення фіксується та відтворюється.»
01 — Проблема
Корпоративні казначейські команди отримують банківські виписки у форматах CAMT, PAIN.001, MT940, OFX, CSV та сканованих PDF від десятків банків. Кожен формат несе різну семантику полів, кодування та неоднозначності. Більшість команд вручну будують крихкі парсери під кожен банк, що блокує прогнозування грошових потоків у режимі реального часу, виявлення шахрайства та готову до аудиту звірку.
02 — Що я побудував
Open-source-інструментарій на Python, що уніфікує всі поширені формати банківських виписок у єдиний нормалізований потік транзакцій. Парсери CAMT / MT940 / PAIN зі схемною валідацією, OCR-резерв для сканованих PDF, детерміноване зіставлення полів та аудиторські докази рівня SR 11-7 для кожного кроку перетворення.
У цифрах
- 6 форматів
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- По полях
- Походження: вихідний формат + версія парсера фіксуються
- BCBS 239
- Узгоджено з агрегацією ризик-даних
- Apache-2.0 / MIT
- Вільне використання, форк, аудит
03 — Інженерна строгість
Підтримувані формати
CAMT (.052, .053, .054), MT940, OFX, CSV, сканований PDF (OCR)
Ціль нормалізації
Єдина уніфікована схема запису транзакції
Аудиторський слід
Походження по кожному полю — вихідний формат + версія парсера фіксуються для кожного рядка
Ліцензія
Apache-2.0 / MIT
04 — Незалежно підтверджено
- Представлено у статті від 2026-06-14: From Bank Statements to Unified Transaction Intelligence
- Розроблено для виконання вимог BCBS 239 щодо агрегації ризик-даних