El fallo silencioso de datos que corrompe un informe sin avisar
· calidad de datos, ETL, confiabilidad
En resumen: los peores fallos de datos son los que no lanzan ningún error. La carga corre, el informe se genera y el número está mal. Así ocurre un fallo silencioso, y este es el diseño que lo evita.
Por qué el silencio es peor que la caída
Un pipeline que se cae se arregla el mismo día: alguien ve la alerta roja y actúa. Un pipeline que sigue corriendo con datos malos es mucho más peligroso: el número equivocado llega a una decisión antes de que alguien lo note. Cuando aparece, ya se confió en él.
Cómo ocurre
La mayoría de los fallos silenciosos empiezan con un cambio que nadie avisó:
- Un archivo de origen agrega o quita una columna y todos los campos siguientes se desplazan.
- Un formato de fecha cambia de
MM/DDaDD/MMy la mitad de las filas caen en el mes equivocado. - Un join aguas arriba pierde filas, y un total baja un 3% sin ningún error.
En los tres casos la carga tiene éxito. Nadie le dijo al pipeline qué es "correcto", así que no tiene con qué comparar.
El diseño que lo detiene
La solución no es más heroísmo. Es estructura:
- Un contrato de datos en la entrada. Describe la forma que esperas: columnas, tipos, rangos. Cuando la fuente cambia, el contrato falla primero, y en voz alta, antes de que el dato malo se propague.
- Capas separadas. Mantén ingesta, validación y transformación aparte, para atrapar el problema en la etapa donde aparece y no dentro del informe.
- Una cuarentena. Las filas que rompen las reglas se retienen y se señalan, no se descartan en silencio ni pasan. Las filas buenas llegan al informe; las malas quedan visibles para revisión.
Esa es la diferencia entre un pipeline que falla de forma segura y uno que falla en silencio. Lo construyo así en cada proyecto, porque en finanzas un número equivocado tiene un costo real y visible.
Es exactamente lo que hago en Un pipeline de datos que se rompe fuerte y temprano, nunca en silencio.
Un caso de datos al mes
Historias reales de lo que rompe un pipeline y un cierre, y cómo resolverlo. Sin spam, cancela cuando quieras.