Diagnóstico de Abandono en una Plataforma de Streaming Hispanohablante
Visión general
De qué trata este proyecto.
Recibes un volcado anonimizado de 180.000 cuentas con 18 meses de eventos (registros, sesiones, suscripciones, cancelaciones) y un diccionario de variables. Limpia el dataset (valores nulos, duplicados, husos horarios mezclados entre México y Argentina), construye cohortes mensuales de alta, entrena un modelo de clasificación binaria de churn a 30 días (regresión logística + un gradient boosting como referencia) y reporta las 5 variables con mayor poder explicativo. El éxito se mide por: AUC (Area Under the Curve — área bajo la curva ROC) por encima de 0,75 en el conjunto de prueba, una segmentación de cohortes accionable y una memoria que la directora de producto pueda leer sin saber estadística.
El Briefing
Lo que harás y lo que demostrarás.
Identificar qué cohortes y comportamientos predicen el abandono a 30 días y traducirlo en una recomendación priorizada para el equipo de producto.
Earning criteria — what you'll demonstrate
- Aplicar un flujo end-to-end de ciencia de datos sobre un dataset real y sucio
- Construir un modelo de clasificación con evaluación honesta (train/test, validación cruzada)
- Comunicar hallazgos cuantitativos a una audiencia no técnica
- Documentar el análisis para que otra persona pueda reproducirlo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico de Datos
El reto cubre exactamente el ciclo diario de un científico de datos junior en una empresa de producto: pasar de un dataset sucio a una recomendación priorizada respaldada por un modelo razonable y una memoria que el negocio entiende.
Este proyecto afina
- data-wrangling
- classification
- data-storytelling
Ingeniero de Aprendizaje Automático
Construir un pipeline reproducible de features y modelo, con validación honesta, prepara para el trabajo de un ML Engineer junior que tiene que llevar modelos del notebook al servicio.
Este proyecto afina
- feature-engineering
- classification
- python
Científico de IA Aplicada
Traducir un análisis cuantitativo en una decisión de negocio respaldada por números es el núcleo del trabajo de un applied AI scientist en producto.
Este proyecto afina
- exploratory-data-analysis
- classification
- data-storytelling