Skip to contentSkip to content
Certificados verificados. En cadena. Para siempre.Más información
Ewance
Iniciar sesión
Cover image for Aprender locomoción cuadrúpeda con reinforcement learning
Code

Aprender locomoción cuadrúpeda con reinforcement learning

FreeVerified credential4 semanasExpert

Visión general

De qué trata este proyecto.

Trabajarás con Isaac Gym o Isaac Lab que permite entrenar en miles de robots simulados en paralelo. Implementarás un setup PPO sobre un modelo del cuadrúpedo (similar a Unitree A1/Go1) con currículo de terreno (plano → escalones → pedregal → pendientes inclinadas). Evaluarás (1) tasa de éxito sobre 100 episodios por terreno, (2) coste de transporte (cost of transport), (3) robustez a perturbaciones laterales y (4) sim-to-real readiness via domain randomization. El éxito es superar al baseline MPC en al menos 3 de 4 terrenos con métricas estadísticamente significativas.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Entrenar una política de locomoción RL que supere al baseline MPC en terrenos irregulares y demuestre readiness para sim-to-real.

Earning criteria — what you'll demonstrate

  • Diseñar entrenamientos RL en simuladores paralelos modernos
  • Aplicar currículos de dificultad para acelerar convergencia
  • Usar domain randomization para mejorar transferencia sim-to-real
  • Evaluar políticas de control con métricas operativas, no solo recompensa

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Research Scientist

Entrenar RL para locomoción cuadrúpeda en simulación paralela y compararla con MPC es el formato estándar de los papers recientes de RSS o CoRL en el área.

Este proyecto afina

  • reinforcement-learning
  • learning-based-control
  • isaac-gym

ML Researcher

Diseñar currículos y randomizaciones que generalicen es exactamente lo que entrena el reto y se espera de quien publica en RL aplicado.

Este proyecto afina

  • reinforcement-learning
  • domain-randomization
  • isaac-gym

AI Engineer

Llevar políticas RL a un plan creíble de despliegue en hardware es trabajo AI Engineer en robótica de campo.

Este proyecto afina

  • pytorch
  • domain-randomization
  • sim-to-real

Una cosa más

Puedes tener una credencial en tu CV para el viernes.