Acelerar entrenamiento de modelo con CUDA para banca AWS LATAM
Visión general
De qué trata este proyecto.
Recibirás dataset anonimizado (8 millones de filas, 240 features). Migra el pipeline de preprocesamiento a cuDF y el entrenamiento a XGBoost GPU. Perfila la pipeline con Nsight Systems para identificar bottlenecks (transferencia host-device, kernels, sincronización). Compara entrenamiento CPU vs GPU en tiempo, coste por entrenamiento (precio EC2) y métricas de modelo. Documenta el plan operativo (cuándo CPU sigue valiendo). Entrega código, perfiles Nsight, comparativo de coste y dossier para el equipo de data science.
El Briefing
Lo que harás y lo que demostrarás.
Migrar el entrenamiento XGBoost a GPU obteniendo entrenamiento diario viable en menos de 90 minutos con coste competitivo vs CPU.
Earning criteria — what you'll demonstrate
- Migrar pipelines de datos a GPU con RAPIDS cuDF
- Perfilar aplicaciones GPU con Nsight Systems
- Atribuir bottlenecks a transferencia, kernel o sincronización
- Justificar coste GPU con comparativo defendible
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Software
Migrar pipelines a GPU con perfilado real es la habilidad HPC aplicada que muchas empresas buscan para reducir time-to-train.
Este proyecto afina
- gpu-computing
- rapids
- performance-analysis
Ingeniero de Datos
Quien hace data engineering en GPU acelera pipelines completos — competencia diferenciadora frente a perfiles CPU-only.
Este proyecto afina
- rapids
- xgboost
- gpu-computing