Postmortems

Postmortems, no testimonios.

Incidentes reales en producción, anonimizados: qué pasaba, qué hicimos para apagar el fuego y cómo blindamos el sistema. Lo que aprendimos a las 3 AM, para que no te pase a vos.

Fintech mayo de 2026

Un certificado TLS vencido tiró toda la producción un domingo

Postmortem: cómo un certificado SSL/TLS vencido dejó una fintech sin producción 3 horas un domingo, y cómo lo resolvimos y blindamos para que no vuelva a pasar.

RESULTADO Producción arriba en 38 min · 0 incidentes de cert desde entonces
Leer postmortem →
SaaS B2B abril de 2026

El memory leak que tiraba el servicio cada 36 horas

Postmortem: un memory leak hacía que Kubernetes matara el pod por OOM cada día y medio. Cómo lo diagnosticamos sin reescribir la app y estabilizamos producción.

RESULTADO De caídas cada 36h a 0 reinicios por OOM en 6 semanas
Leer postmortem →