Analizadores CAMT / MT940 / PAIN validados por esquema, alternativa OCR para PDF escaneados, mapeo de campos determinista y evidencia de auditoría con calidad SR 11-7: cada paso de transformación queda registrado y es reproducible.
01 — Problema
Los equipos de tesorería corporativa reciben extractos bancarios en CAMT, PAIN.001, MT940, OFX, CSV y PDF escaneados de decenas de bancos. Cada formato impone semántica de campos, codificaciones y ambigüedades distintas. La mayoría de los equipos construye a mano analizadores frágiles por banco, bloqueando la previsión de caja en tiempo real, la detección de fraude y la conciliación lista para auditoría.
02 — Lo que construí
Un conjunto de herramientas Python de código abierto que unifica todos los formatos habituales de extracto bancario en un flujo único y normalizado de transacciones. Analizadores CAMT / MT940 / PAIN validados por esquema, alternativa OCR para PDF escaneados, mapeo de campos determinista y evidencia de auditoría con calidad SR 11-7 para cada paso de transformación.
En cifras
- 6 formats
- CAMT (.052/.053/.054), MT940, OFX, CSV, OCR PDF
- Per-field
- Procedencia: formato origen y versión del analizador registrados
- BCBS 239
- Alineado con la agregación de datos de riesgo
- Apache-2.0 / MIT
- De uso libre, bifurcable y auditable
03 — Rigor de ingeniería
Formatos compatibles
CAMT (.052, .053, .054), MT940, OFX, CSV, PDF escaneado (OCR)
Objetivo de normalización
Esquema único y unificado de registro de transacciones
Pista de auditoría
Procedencia por campo: formato origen y versión del analizador registrados por fila
Licencia
Apache-2.0 / MIT
04 — Verificado independientemente
- Destacado en el artículo del 14-06-2026: De los extractos bancarios a la inteligencia unificada de transacciones
- Diseñado para satisfacer los requisitos de agregación de datos de riesgo de BCBS 239