Saltar al contenido

El fallo silencioso de datos que corrompe un informe sin avisar

· calidad de datos, ETL, confiabilidad

En resumen: los peores fallos de datos son los que no lanzan ningún error. La carga corre, el informe se genera y el número está mal. Así ocurre un fallo silencioso, y este es el diseño que lo evita.

Por qué el silencio es peor que la caída

Un pipeline que se cae se arregla el mismo día: alguien ve la alerta roja y actúa. Un pipeline que sigue corriendo con datos malos es mucho más peligroso: el número equivocado llega a una decisión antes de que alguien lo note. Cuando aparece, ya se confió en él.

Cómo ocurre

La mayoría de los fallos silenciosos empiezan con un cambio que nadie avisó:

  1. Un archivo de origen agrega o quita una columna y todos los campos siguientes se desplazan.
  2. Un formato de fecha cambia de MM/DD a DD/MM y la mitad de las filas caen en el mes equivocado.
  3. Un join aguas arriba pierde filas, y un total baja un 3% sin ningún error.

En los tres casos la carga tiene éxito. Nadie le dijo al pipeline qué es "correcto", así que no tiene con qué comparar.

El diseño que lo detiene

La solución no es más heroísmo. Es estructura:

  • Un contrato de datos en la entrada. Describe la forma que esperas: columnas, tipos, rangos. Cuando la fuente cambia, el contrato falla primero, y en voz alta, antes de que el dato malo se propague.
  • Capas separadas. Mantén ingesta, validación y transformación aparte, para atrapar el problema en la etapa donde aparece y no dentro del informe.
  • Una cuarentena. Las filas que rompen las reglas se retienen y se señalan, no se descartan en silencio ni pasan. Las filas buenas llegan al informe; las malas quedan visibles para revisión.

Esa es la diferencia entre un pipeline que falla de forma segura y uno que falla en silencio. Lo construyo así en cada proyecto, porque en finanzas un número equivocado tiene un costo real y visible.

Un caso de datos al mes

Historias reales de lo que rompe un pipeline y un cierre, y cómo resolverlo. Sin spam, cancela cuando quieras.

¿Este problema se parece al tuyo?

Una conversación de 30 minutos, sin compromiso. Te digo dónde está el riesgo y qué resolver primero.