Política de pricing dinámico con bandidos contextuales en e-commerce
Visión general
De qué trata este proyecto.
Recibes 6 meses de eventos (vistas + compras) sobre los 80 SKUs y 8 niveles de precio discretos por SKU. Implementa LinUCB con 12 features contextuales y úsalo en una validación offline tipo replay (matching de eventos donde el precio que LinUCB elegiría coincide con el que se mostró). Estima uplift de revenue vs. la política fija actual y diseña un plan de despliegue gradual (epsilon-cautious + límites por SKU). Éxito = uplift estimado >= 8% en validación replay con CI superpuesto a cero solo para minoría de SKUs, y un plan de despliegue defendible ante revenue.
El Briefing
Lo que harás y lo que demostrarás.
Validar offline una política de pricing dinámico con LinUCB sobre 80 SKUs y proponer un despliegue gradual seguro.
Earning criteria — what you'll demonstrate
- Aplicar bandidos contextuales como caso especial de RL para decisiones independientes
- Implementar LinUCB con sus garantías de exploración
- Validar políticas offline con replay/IPS y entender sus limitaciones
- Diseñar despliegues cautelosos en producción de cara al cliente
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico/a de Datos
Aplicar bandidos contextuales con validación offline y plan de despliegue es exactamente la franja senior del trabajo de data scientist en e-commerce y marketplaces.
Este proyecto afina
- contextual-bandits
- offline-evaluation
- ab-testing
Ingeniero/a de Machine Learning
Llevar LinUCB de notebook a un plan de producción cauteloso con telemetría es trabajo nuclear del MLE en pricing y growth.
Este proyecto afina
- reinforcement-learning
- python
- experiment-design
Científico/a Aplicado/a de IA
Convertir una decisión secuencial en una política con guardrails y comunicación a revenue es el día a día del applied AI scientist en retail.
Este proyecto afina
- contextual-bandits
- experiment-design
- offline-evaluation