Visión general
De qué trata este proyecto.
Trabajarás con Isaac Gym o Isaac Lab que permite entrenar en miles de robots simulados en paralelo. Implementarás un setup PPO sobre un modelo del cuadrúpedo (similar a Unitree A1/Go1) con currículo de terreno (plano → escalones → pedregal → pendientes inclinadas). Evaluarás (1) tasa de éxito sobre 100 episodios por terreno, (2) coste de transporte (cost of transport), (3) robustez a perturbaciones laterales y (4) sim-to-real readiness via domain randomization. El éxito es superar al baseline MPC en al menos 3 de 4 terrenos con métricas estadísticamente significativas.
El Briefing
Lo que harás y lo que demostrarás.
Entrenar una política de locomoción RL que supere al baseline MPC en terrenos irregulares y demuestre readiness para sim-to-real.
Earning criteria — what you'll demonstrate
- Diseñar entrenamientos RL en simuladores paralelos modernos
- Aplicar currículos de dificultad para acelerar convergencia
- Usar domain randomization para mejorar transferencia sim-to-real
- Evaluar políticas de control con métricas operativas, no solo recompensa
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosResearch Scientist
Entrenar RL para locomoción cuadrúpeda en simulación paralela y compararla con MPC es el formato estándar de los papers recientes de RSS o CoRL en el área.
Este proyecto afina
- reinforcement-learning
- learning-based-control
- isaac-gym
ML Researcher
Diseñar currículos y randomizaciones que generalicen es exactamente lo que entrena el reto y se espera de quien publica en RL aplicado.
Este proyecto afina
- reinforcement-learning
- domain-randomization
- isaac-gym
AI Engineer
Llevar políticas RL a un plan creíble de despliegue en hardware es trabajo AI Engineer en robótica de campo.
Este proyecto afina
- pytorch
- domain-randomization
- sim-to-real