Diseña una política de pricing dinámico para una hotelera caribeña
Visión general
De qué trata este proyecto.
Recibirás 4 años de datos anonimizados de booking y precios por noche por propiedad, más eventos exógenos (festivos, eventos locales). Construye un simulador de demanda que reproduzca la elasticidad observada por segmento (familias, parejas, business). Entrena dos políticas: (1) un baseline value iteration sobre demanda discretizada, (2) PPO o SAC sobre un environment continuo. Compara contra una réplica de la política de reglas actual sobre los mismos 6 meses simulados. Reporta RevPAR (Revenue per Available Room — ingreso por habitación disponible), ocupación y volatilidad de precio. El éxito significa mejorar RevPAR al menos 8 por ciento con volatilidad acotada para no asustar al cliente.
El Briefing
Lo que harás y lo que demostrarás.
Entrena una política de pricing dinámico con RL que mejore RevPAR 8 por ciento vs reglas actuales manteniendo volatilidad de precio acotada.
Earning criteria — what you'll demonstrate
- Calibrar un simulador de demanda contra datos reales antes de entrenar RL
- Aplicar PPO o SAC sobre un MDP continuo de pricing
- Diseñar funciones de recompensa que incluyan restricciones de negocio (volatilidad)
- Pasar de simulación a un plan de despliegue por fases con A/B test
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador de ML
Dynamic pricing con RL sigue siendo un caso de uso emergente en hospitality y aerolíneas; un proyecto end-to-end es portfolio diferenciado.
Este proyecto afina
- reinforcement-learning
- dynamic-pricing
- ppo
Científico Aplicado de IA
Calibrar el simulador y diseñar el A/B test posterior es la cadena completa que el applied AI scientist domina.
Este proyecto afina
- simulation
- policy-evaluation
- dynamic-pricing
Ingeniero de Aprendizaje Automático
Empaquetar el environment y la política para uso operativo es trabajo de MLE en producto de pricing.
Este proyecto afina
- python
- simulation
- reinforcement-learning