Debug de latencia p99 con trazas distribuidas en una API hispana
Visión general
De qué trata este proyecto.
Recibe acceso a Jaeger con 4 servicios instrumentados parcialmente (auth, catalog, progress, billing), métricas Prometheus y logs. Audita instrumentación, completa span enrichment crítico (faltan tenant_id y db.statement), reproduce el patrón miércoles con load synthetic. Analiza trazas seleccionando p99 con tail-based sampling, identifica los 2 servicios y el endpoint culpable (probable: query N+1 en catalog + lock contention en progress). Propón y aplica fix (índice DB, caching de catálogo, refactor de transacción). Valida con 1 semana en producción. Entrega: informe (10 páginas), PRs de instrumentación y fix, evidencia antes/después en Jaeger y deck para el equipo (8 láminas).
El Briefing
Lo que harás y lo que demostrarás.
Diagnosticar y remediar oscilación de p99 latencia en API edtech usando trazas distribuidas, dejando p99 estable bajo 800 ms en horario punta validado en producción.
Earning criteria — what you'll demonstrate
- Usar trazas distribuidas para diagnóstico real, no solo demo
- Aplicar tail-based sampling para capturar la cola larga
- Combinar trazas con métricas y logs para causa raíz
- Defender remediación con evidencia antes/después clara
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosBackend Engineer
El backend engineer que sabe diagnosticar con trazas y aplicar fix de DB sin generar regresión es indispensable en equipos de plataforma de SaaS hispanos.
Este proyecto afina
- performance-debugging
- database-optimization
- distributed-tracing