Visión general
De qué trata este proyecto.
Lee la teoría de Cormode y Muthukrishnan sobre Count-Min Sketch (CMS) y la familia HyperLogLog. Implementa ambas estructuras desde cero (sin usar librerías que las traigan ya hechas — sí puedes usar funciones hash como xxHash). Diseña los parámetros (anchura, profundidad, buckets) para garantizar epsilon menor o igual a 0,005 con probabilidad mayor o igual a 0,99. Valida sobre 4 trazas anonimizadas (300 millones de eventos cada una). Compara consumo de memoria y latencia p99 frente a una baseline exacta en Redis. Entrega el código, un informe de 8-10 páginas y un cuaderno Jupyter con las gráficas error-vs-memoria.
El Briefing
Lo que harás y lo que demostrarás.
Reemplazar conteos exactos por estructuras probabilísticas (CMS + HyperLogLog) sobre 4 trazas de 300 millones de eventos manteniendo error menor o igual a 0,005 con garantía probabilística.
Earning criteria — what you'll demonstrate
- Aplicar análisis probabilístico para acotar el error de estructuras randomizadas
- Implementar Count-Min Sketch y HyperLogLog sin depender de librerías de alto nivel
- Medir trade-offs reales entre memoria, latencia y exactitud
- Justificar parámetros desde la teoría, no por prueba y error
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Backend
Implementar estructuras probabilísticas con garantías matemáticas es exactamente el tipo de trabajo que distingue a un ingeniero de backend senior en plataformas de streaming a escala — combina algoritmos avanzados con perf-engineering real.
Este proyecto afina
- probabilistic-data-structures
- algorithm-analysis
- performance-benchmarking
Ingeniero de Datos
Los ingenieros de datos que entienden cuándo reemplazar exactitud por aproximación con error acotado bajan facturas cloud un orden de magnitud y se ganan el respeto del equipo de plataforma.
Este proyecto afina
- hyperloglog
- count-min-sketch
- performance-benchmarking
Arquitecto de Sistemas
Los arquitectos que pueden justificar trade-offs algorítmicos con cotas probabilísticas, no con benchmarks anecdóticos, son los que diseñan plataformas de streaming que escalan a miles de millones de eventos al día.
Este proyecto afina
- probabilistic-data-structures
- algorithm-analysis
- count-min-sketch