« Parseurs CAMT / MT940 / PAIN validés par schéma, repli OCR pour les PDF numérisés, mappage déterministe des champs, preuves d'audit de niveau SR 11-7 — chaque étape de transformation enregistrée et reproductible. »
01 — Problème
Les équipes de trésorerie d'entreprise reçoivent des relevés bancaires en CAMT, PAIN.001, MT940, OFX, CSV et PDF numérisés depuis des dizaines de banques. Chaque format porte une sémantique de champs, un encodage et des ambiguïtés différents. La plupart des équipes construisent manuellement des parseurs fragiles par banque, ce qui bloque la prévision de trésorerie en temps réel, la détection de la fraude et la réconciliation prête pour l'audit.
02 — Ce que j'ai construit
Une boîte à outils Python open source qui unifie tous les formats courants de relevés bancaires en un flux unique et normalisé de transactions. Parseurs CAMT / MT940 / PAIN validés par schéma, repli OCR pour les PDF numérisés, mappage déterministe des champs et preuves d'audit de niveau SR 11-7 pour chaque étape de transformation.
En chiffres
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, PDF OCR
- Per-field
- Traçabilité : format source et version du parseur journalisés
- BCBS 239
- Aligné sur l'agrégation des données de risque
- Apache-2.0 / MIT
- Libre d'usage, de fork et d'audit
03 — Rigueur d'ingénierie
Formats pris en charge
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF numérisé (OCR)
Cible de normalisation
Schéma unique unifié d'enregistrement de transaction
Piste d'audit
Traçabilité par champ — format source et version du parseur journalisés par ligne
Licence
Apache-2.0 / MIT
04 — Vérifié indépendamment
- Présenté dans l'article du 2026-06-14 : From Bank Statements to Unified Transaction Intelligence
- Conçu pour satisfaire aux exigences d'agrégation des données de risque BCBS 239