Skip to contentSkip to content
Certificados verificados. En cadena. Para siempre.Más información
Cover image for RL Basado en Modelo para Tienda con Recomendaciones en Bogotá
Research

RL Basado en Modelo para Tienda con Recomendaciones en Bogotá

FreeVerified credential4 semanasExpert

Visión general

De qué trata este proyecto.

Recibirás un simulador construido sobre 6 meses de logs anonimizados (~3M eventos, 80k usuarios anonimizados) que reproduce probabilidades de clic e ingresos por sesión. Entrena un agente Model-Based RL (puedes basarte en Dreamer, MuZero o World Models según prefieras) que aprenda primero un modelo del entorno y planifique sobre él. Compara contra dos líneas base: filtrado colaborativo y bandido contextual. Reporta ingreso esperado por sesión, regret acumulado y un análisis off-policy con intervalos del 95%. Termina con un memo de 3 páginas para producto.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Compara Model-Based RL frente a filtrado colaborativo y bandidos contextuales para recomendaciones de outfit, con evaluación off-policy honesta.

Earning criteria — what you'll demonstrate

  • Implementar un agente que aprenda un modelo del entorno y planifique sobre él
  • Comparar RL contra líneas base de recomendación clásicas de forma justa
  • Aplicar evaluación off-policy con muestreo de importancia y sus salvaguardas
  • Comunicar incertidumbre estadística a producto sin perder rigor

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Investigador en Aprendizaje Automático

Aprender un modelo del entorno, planear sobre él y evaluar off-policy es trabajo de ML Researcher aplicado en cualquier equipo de personalización con escala.

Este proyecto afina

  • model-based-rl
  • off-policy-evaluation
  • experiment-design

Científico de Datos

El énfasis en evaluación off-policy, IPS y bandas de confianza prepara directamente para un puesto de Data Scientist en producto.

Este proyecto afina

  • off-policy-evaluation
  • experiment-design
  • benchmarking

Científico en IA Aplicada

Traducir un experimento de RL a una decisión de producto con métricas honestas es el día a día del Applied AI Scientist en retailers tech.

Este proyecto afina

  • model-based-rl
  • benchmarking
  • experiment-design

Una cosa más

Puedes tener una credencial en tu CV para el viernes.