La panne silencieuse des données qui corrompt un rapport sans prévenir
· qualité des données, ETL, fiabilité
En résumé : les pires pannes de données sont celles qui ne lèvent aucune erreur. Le chargement tourne, le rapport s'affiche, et le chiffre est faux. Voici comment survient une panne silencieuse, et le design qui l'empêche.
Pourquoi le silence est pire que la panne
Un pipeline qui plante est corrigé le jour même : quelqu'un voit l'alerte rouge et agit. Un pipeline qui continue de tourner avec de mauvaises données est bien plus dangereux : le mauvais chiffre atteint une décision avant que personne ne le remarque. Quand il refait surface, on lui a déjà fait confiance.
Comment ça arrive
La plupart des pannes silencieuses commencent par un changement que personne n'a annoncé :
- Un fichier source ajoute ou retire une colonne, et tous les champs suivants se décalent.
- Un format de date passe de
MM/JJàJJ/MM, et la moitié des lignes tombent dans le mauvais mois. - Une jointure en amont perd des lignes, et un total baisse de 3 % sans aucune erreur.
Dans les trois cas, le chargement réussit. Personne n'a dit au pipeline ce qui est « correct », il n'a donc rien à quoi comparer.
Le design qui l'arrête
La solution n'est pas plus d'héroïsme. C'est de la structure :
- Un contrat de données à l'entrée. Décrivez la forme attendue : colonnes, types, plages. Quand la source dérive, le contrat échoue en premier, et bruyamment, avant que la mauvaise donnée ne se propage.
- Des couches séparées. Gardez ingestion, validation et transformation à part, pour attraper le problème là où il apparaît plutôt qu'au fond du rapport.
- Une quarantaine. Les lignes hors règles sont retenues et signalées, ni supprimées en silence ni laissées passer. Les bonnes lignes alimentent le rapport ; les mauvaises restent visibles pour revue.
C'est la différence entre un pipeline qui échoue de façon sûre et un pipeline qui échoue en silence. Je le construis ainsi dans chaque projet, parce qu'en finance un mauvais chiffre a un coût réel et visible.
C'est exactement ce que je fais en Un pipeline de données qui casse fort et tôt — jamais en silence.
Un cas data par mois
Des histoires réelles de ce qui casse un pipeline et une clôture, et comment y remédier. Sans spam, désinscription à tout moment.