Definición de SLOs y Error Budgets para Banco Digital
Visión general
De qué trata este proyecto.
Para cada uno de los 4 servicios identifica los SLIs (Service Level Indicators) candidatos: latencia, error rate, freshness, throughput. Elige 2-3 por servicio basándote en lo que de verdad importa al usuario. Define SLO por SLI con justificación: 99,9% de éxito en login (auth), 99,95% disponibilidad ledger, p99 menor a 300ms para payments, etc. Implementa el cálculo en Prometheus con sloth (generador declarativo). Configura paneles Grafana con burn rate alerts (alertas de consumo). Define la política: si error budget mensual restante menor al 20%, freeze de features hasta recuperar. Entrega: documento de SLOs de 12 páginas, manifiestos Sloth versionados, paneles Grafana, política de release, presentación de 30 minutos a producto + SRE.
El Briefing
Lo que harás y lo que demostrarás.
Definir SLOs accionables para 4 servicios críticos y operar la política de release condicionada al error budget consumido.
Earning criteria — what you'll demonstrate
- Diseñar SLIs que reflejan lo que importa al usuario, no a la métrica
- Justificar SLO targets desde negocio y desde realidad operativa
- Implementar SLOs con herramientas declarativas (Sloth)
- Operar política de error budget sin que se convierta en burocracia
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.