Skip to contentSkip to content
Certificados verificados. En cadena. Para siempre.Más información
Ewance
Iniciar sesión
Cover image for Bosques de Conteo Aproximado para Logs de Telemetría
Code

Bosques de Conteo Aproximado para Logs de Telemetría

FreeVerified credential3 semanasAdvanced

Visión general

De qué trata este proyecto.

Lee la teoría de Cormode y Muthukrishnan sobre Count-Min Sketch (CMS) y la familia HyperLogLog. Implementa ambas estructuras desde cero (sin usar librerías que las traigan ya hechas — sí puedes usar funciones hash como xxHash). Diseña los parámetros (anchura, profundidad, buckets) para garantizar epsilon menor o igual a 0,005 con probabilidad mayor o igual a 0,99. Valida sobre 4 trazas anonimizadas (300 millones de eventos cada una). Compara consumo de memoria y latencia p99 frente a una baseline exacta en Redis. Entrega el código, un informe de 8-10 páginas y un cuaderno Jupyter con las gráficas error-vs-memoria.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Reemplazar conteos exactos por estructuras probabilísticas (CMS + HyperLogLog) sobre 4 trazas de 300 millones de eventos manteniendo error menor o igual a 0,005 con garantía probabilística.

Earning criteria — what you'll demonstrate

  • Aplicar análisis probabilístico para acotar el error de estructuras randomizadas
  • Implementar Count-Min Sketch y HyperLogLog sin depender de librerías de alto nivel
  • Medir trade-offs reales entre memoria, latencia y exactitud
  • Justificar parámetros desde la teoría, no por prueba y error

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Ingeniero de Backend

Implementar estructuras probabilísticas con garantías matemáticas es exactamente el tipo de trabajo que distingue a un ingeniero de backend senior en plataformas de streaming a escala — combina algoritmos avanzados con perf-engineering real.

Este proyecto afina

  • probabilistic-data-structures
  • algorithm-analysis
  • performance-benchmarking

Ingeniero de Datos

Los ingenieros de datos que entienden cuándo reemplazar exactitud por aproximación con error acotado bajan facturas cloud un orden de magnitud y se ganan el respeto del equipo de plataforma.

Este proyecto afina

  • hyperloglog
  • count-min-sketch
  • performance-benchmarking

Arquitecto de Sistemas

Los arquitectos que pueden justificar trade-offs algorítmicos con cotas probabilísticas, no con benchmarks anecdóticos, son los que diseñan plataformas de streaming que escalan a miles de millones de eventos al día.

Este proyecto afina

  • probabilistic-data-structures
  • algorithm-analysis
  • count-min-sketch

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Bosques de Conteo Aproximado para Logs de Telemetría | Ewance Challenge