Construye un pipeline ML reproducible para una startup de delivery en Medellín
Visión general
De qué trata este proyecto.
Recibes un notebook con un modelo entrenado y unos 1.500 viajes de muestra. Refactoriza en módulos (data, features, train, eval), añade tracking con MLflow, define el pipeline con un orquestador ligero (Prefect o Kedro) y serializa el modelo en formato portable. Documenta cómo re-entrenar desde cero. Éxito: el pipeline corre con un solo comando, MLflow registra el experimento y la documentación basta para que alguien sin contexto re-entrene en 30 minutos.
El Briefing
Lo que harás y lo que demostrarás.
Convertir un notebook de predicción de tiempo de entrega en un pipeline ML reproducible con tracking y documentación.
Earning criteria — what you'll demonstrate
- Refactorizar código exploratorio en módulos productivos
- Aplicar tracking de experimentos como hábito, no como extra
- Diseñar pipelines orquestados ligeros sin sobre-ingeniería
- Escribir documentación que sirva a la persona siguiente
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de MLOps
Convertir notebooks en pipelines reproducibles con tracking es el trabajo cotidiano de MLOps en startups en crecimiento.
Este proyecto afina
- ml-pipelines
- experiment-tracking
- reproducibility
Ingeniero/a de Machine Learning
Un MLE que no sabe refactorizar exploraciones a producción se queda atascado en cualquier equipo.
Este proyecto afina
- ml-pipelines
- code-refactoring
- mlflow
Ingeniero/a de Datos
Pipelines orquestados y reproducibilidad son habilidades transversales con data engineering.
Este proyecto afina
- ml-pipelines
- reproducibility
- code-refactoring