On-Call Sostenible con Rotación, Runbooks y Métricas de Salud
Visión general
De qué trata este proyecto.
Audita el sistema actual: extrae 3 meses de datos de PagerDuty, calcula pages por persona, MTTR, alertas durante horas no laborales, alertas que resultaron en 'no action'. Diseña nueva rotación equitativa (round-robin con backup, follow-the-sun si aplicable). Reescribe criterios de alerta: cada alerta debe ser accionable (SLO burn-rate, no CPU more 80%). Configura health checks automatizados de runbooks (test mensual). Define 4 métricas de salud on-call con objetivos numéricos. Diseña política de compensación on-call (pago por turno + tiempo libre tras incidente nocturno). Diseña formación 2-horas para nuevas incorporaciones. Entrega: auditoría, configuración PagerDuty, alert rules nuevas, dashboard métricas, política, formación grabada.
El Briefing
Lo que harás y lo que demostrarás.
Reducir alertas on-call de ~12/semana a menos de 2 con rotación equitativa, alertas SLO-based y políticas de salud medibles.
Earning criteria — what you'll demonstrate
- Auditar salud de un sistema on-call con datos reales
- Diseñar alertas accionables basadas en SLOs
- Configurar rotación equitativa con backup y reglas claras
- Operar política de compensación que reconozca el coste real
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.