Selección de features con Lasso y árboles para predicción de demanda hortícola
Visión general
De qué trata este proyecto.
Recibes un dataset de 5 años con observaciones semanales para 12 productos y las 180 variables potenciales (con valores faltantes y multicolinealidad). Diseña dos pipelines de selección: (a) Lasso con validación cruzada por bloque temporal, (b) Random Forest con permutation importance. Compara las dos listas resultantes, analiza solapamiento y discrepancias, y propón el conjunto final justificado. Valida en términos predictivos con un modelo final simple (Ridge) usando solo las features seleccionadas vs. usando todas.
El Briefing
Lo que harás y lo que demostrarás.
Reducir 180 features potenciales a un conjunto interpretable de 12-20 usando dos métodos complementarios y validar el coste predictivo de la reducción.
Earning criteria — what you'll demonstrate
- Aplicar Lasso y permutation importance correctamente
- Diseñar validación temporal por bloque para series semanales
- Razonar sobre interpretabilidad vs. capacidad predictiva
- Comunicar decisiones de selección a una audiencia de operaciones
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico/a de Datos
Combinar dos métodos de selección, validar temporalmente y traducir a recomendaciones operativas es trabajo cotidiano de una persona data scientist en agroindustria.
Este proyecto afina
- feature-selection
- lasso
- permutation-importance
Investigador/a de Aprendizaje Automático
Razonar sobre interpretabilidad vs. predicción y discutir validación temporal son habilidades típicas de una persona investigadora ML.
Este proyecto afina
- lasso
- time-aware-validation
- feature-selection
Ingeniero/a de Aprendizaje Automático
Empaquetar pipelines de selección y validar contra baseline es el patrón con el que MLEs entregan modelos a equipos de planificación.
Este proyecto afina
- scikit-learn
- feature-selection
- time-aware-validation