← Volver al índice

Incidente bancario - 2018

TSB Bank (migración fallida)

La migración de plataforma bancaria de TSB falló y dejó a millones de clientes sin acceso a sus cuentas. El incidente generó multas severas y daños reputacionales, destacando la complejidad de los procesos de migración en sistemas críticos.

Tipo de sistema Core bancario y migración
Criticidad Banca - Servicio masivo
Impacto Clientes bloqueados y multas

Identidad y contexto

Base del caso

Una migración bancaria exige pruebas completas y planes de rollback robustos.

1) Identificación del caso

  • Nombre del sistema: Migración de plataforma core de TSB.
  • Organismo responsable: TSB Bank y proveedores tecnológicos.
  • Año del incidente: 2018.
  • Área: Banca, migración de sistemas.

2) Contexto previo

  • Qué hacía el software: gestionaba cuentas, transacciones y servicios digitales.
  • Problema real: modernizar la plataforma y reducir dependencia de terceros.
  • Entorno: millones de clientes finales y servicios 24/7.
  • Complejidad: sistemas legacy y migración masiva de datos.

Naturaleza del bug

Qué falló y cómo se observó

La migración incompleta produjo errores en accesos, balances y sesiones.

3) Descripción del bug

  • Tipo de error: migración fallida / validación insuficiente.
  • Localización: módulos de acceso, balances y transacciones.
  • Lenguaje y componente: core banking y canales digitales.
  • Cómo se introdujo: despliegue masivo sin pruebas completas.

4) Cómo se manifestó

  • Síntoma visible: usuarios sin acceso o con datos incorrectos.
  • Error sistemático: afectó a millones de cuentas.
  • Dependencia: datos migrados y sincronización incompleta.
  • Reproducción: evidente al intentar iniciar sesión.
  • Ejemplo: un cliente veía saldos de otra cuenta o cero.

Impacto

Consecuencias, costos y personas

El fallo bloqueó servicios bancarios y generó costos millonarios.

5) Consecuencias directas

  • Caídas masivas de servicios bancarios.
  • Decisiones automáticas erróneas en procesamiento de cuentas.
  • Interrupciones prolongadas en banca digital.

6) Impacto económico

  • Pérdidas estimadas: cientos de millones en multas y compensaciones.
  • Costos de reparación: restauración de datos y soporte extendido.
  • Impacto reputacional: fuerte deterioro de la confianza.

7) Impacto humano

  • Afectación de usuarios por acceso bloqueado a fondos.
  • Impacto social: frustración y daño a la experiencia del cliente.
  • Investigaciones regulatorias y presión mediática.

Causas y organización

Raíz técnica y fallas de ingeniería

La magnitud de la migración no fue respaldada por pruebas adecuadas.

8) Causa raíz (Root Cause Analysis)

  • Defecto técnico puntual: migración incompleta de datos.
  • Combinación de errores: falta de pruebas integrales y planes de rollback.
  • Falta de pruebas en escenarios de uso masivo.

9) Fallas de ingeniería organizacional

  • Falta de revisión por pares en la migración.
  • QA insuficiente para cambios críticos.
  • Documentación incompleta de procesos de migración.
  • Presión por plazos de negocio.

Detección y respuesta

Cómo se descubrió y se reaccionó

Los reclamos masivos revelaron la magnitud de la falla.

10) Cómo se descubrió

  • Reportes de clientes y caídas de canales digitales.
  • Monitoreo interno con alertas de inconsistencias.

11) Respuesta de la empresa

  • Comunicados públicos y extensiones de soporte.
  • Planes de compensación a clientes afectados.
  • Revisión de procesos de migración.

12) Cómo se arregló

  • Corrección de datos migrados y reconciliaciones.
  • Mejoras en validación previa a migraciones futuras.
  • Pruebas de regresión y simulaciones masivas.

Aprendizajes

Lecciones y enfoque moderno

Las migraciones deben ejecutarse con controles de riesgo y planes de reversión completos.

13) Lecciones aprendidas

  • Validar migraciones con pruebas end-to-end.
  • Diseño defensivo para garantizar consistencia de datos.
  • Importancia de planes de rollback.
  • Evitar despliegos masivos sin fases controladas.

14) Qué se haría hoy distinto

  • CI/CD con migraciones progresivas y canary releases.
  • Observabilidad de reconciliación de datos en tiempo real.
  • Feature flags para habilitar nuevas funciones.
  • Estándares regulatorios más estrictos.
  • IA para detectar inconsistencias de datos.