Predice el abandono mensual de una academia de idiomas online
Visión general
De qué trata este proyecto.
Recibes un dataset anonimizado con 60.000 filas (una por persona-mes) y unas 25 features: minutos de clase, lecciones completadas, notas en evaluaciones, plan de pago y país. El objetivo binario es 'canceló el mes siguiente'. Entrena al menos tres modelos (regresión logística, random forest y un gradient boosting), compara con validación cruzada temporal y reporta AUC-ROC (Area Under the ROC Curve — área bajo la curva ROC) y precisión en el top-10 % de mayor riesgo. Entrega además una tabla con las 8 features más importantes según el mejor modelo. El éxito es superar al heurístico actual en al menos 15 puntos de precisión en el top-10 %.
El Briefing
Lo que harás y lo que demostrarás.
Predecir, con datos de comportamiento de las últimas 4 semanas, quién cancelará en los próximos 30 días con mejor precisión que el heurístico actual.
Earning criteria — what you'll demonstrate
- Encuadrar un problema de negocio como clasificación supervisada
- Aplicar validación cruzada temporal correctamente para datos con orden
- Comparar modelos con métricas adecuadas al desbalance de clases
- Comunicar la importancia de features a un equipo no técnico
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico de Datos
Predecir abandono con datos de comportamiento y entregar una lista priorizada a Success es uno de los proyectos canónicos de cualquier persona junior en data science de una empresa SaaS.
Este proyecto afina
- supervised-learning
- gradient-boosting
- model-evaluation
Ingeniero/a de Machine Learning
Comparar tres modelos con validación temporal correcta y elegir uno basado en métricas de negocio es justo el músculo que se ejercita el primer mes como MLE.
Este proyecto afina
- supervised-learning
- logistic-regression
- python
Científico/a de IA Aplicada
Traducir un problema de negocio difuso en una métrica clara (precisión@top-10 %) y validar contra un heurístico es la mentalidad de aplicación que distingue al rol.
Este proyecto afina
- model-evaluation
- feature-importance
- supervised-learning