Algoritmos aleatorizados para muestreo en streaming de e-commerce
Visión general
De qué trata este proyecto.
Recibes 30 días anonimizados de eventos (alrededor de 600 M eventos en total). Implementa: (1) reservoir sampling para muestrear K eventos uniformemente, (2) count-min sketch para top-k frecuentes, (3) HyperLogLog para conteo aproximado de únicos. Para cada uno: análisis probabilístico de error, configuración de parámetros, y benchmark de memoria y precisión vs solución exacta. Entrega código, un informe de 6 páginas con análisis teórico + empírico y un dashboard que muestre las métricas en streaming.
El Briefing
Lo que harás y lo que demostrarás.
Implementar algoritmos aleatorizados de streaming con análisis probabilístico para sustituir cálculos exactos no escalables en analítica de e-commerce.
Earning criteria — what you'll demonstrate
- Implementar y configurar estructuras probabilísticas clásicas
- Analizar formalmente el error y la memoria por elección de parámetros
- Razonar sobre trade-off precisión/memoria en cargas reales
- Validar empíricamente garantías probabilísticas
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosBackend Engineer
Implementar estructuras probabilísticas de streaming en producción es habilidad core de una Backend Engineer en cualquier producto con tráfico real.
Este proyecto afina
- streaming-algorithms
- probabilistic-data-structures
- python
Software Engineer
Las Software Engineers que combinan análisis probabilístico con validación empírica resuelven problemas de escala que otros declaran intratables.
Este proyecto afina
- randomized-algorithms
- algorithm-analysis
- python