Control de cardinalidad en métricas Prometheus para un marketplace
Visión general
De qué trata este proyecto.
Audita la base de métricas (200k series activas, 14 servicios) usando promtool tsdb analyze y queries específicas de cardinalidad. Identifica las 15 métricas más caras y sus dimensiones culpables (probable: tenant_id sin agregación, user_id como label, path con ids embebidos). Propón remediación por métrica: drop, agregación, relabeling, exemplars en lugar de label. Implementa en collector OpenTelemetry y en Prometheus relabel configs. Mide reducción real durante 2 semanas. Construye un linter pre-commit que bloquee nuevas métricas con cardinalidad explosiva. Entrega: informe (12 páginas), PRs de remediación, linter funcional y guía para equipos (5 páginas).
El Briefing
Lo que harás y lo que demostrarás.
Reducir 40 % la factura de Prometheus+Mimir auditando cardinalidad sin perder señales críticas, y dejar un linter que prevenga nuevas explosiones.
Earning criteria — what you'll demonstrate
- Diagnosticar cardinalidad excesiva con herramientas reales
- Aplicar drop / aggregation / relabel sin perder señales críticas
- Diseñar guard-rails que prevengan repetición del problema
- Comunicar trade-offs de cardinalidad a equipos de producto
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.