Aprender locomoción cuadrúpeda con reinforcement learning

FreeVerified credential4 semanasExpert

Visión general

De qué trata este proyecto.

Trabajarás con Isaac Gym o Isaac Lab que permite entrenar en miles de robots simulados en paralelo. Implementarás un setup PPO sobre un modelo del cuadrúpedo (similar a Unitree A1/Go1) con currículo de terreno (plano → escalones → pedregal → pendientes inclinadas). Evaluarás (1) tasa de éxito sobre 100 episodios por terreno, (2) coste de transporte (cost of transport), (3) robustez a perturbaciones laterales y (4) sim-to-real readiness via domain randomization. El éxito es superar al baseline MPC en al menos 3 de 4 terrenos con métricas estadísticamente significativas.

CredentialBlockchain-anchored

ShareableLinkedIn-ready

LanguageEnglish

PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Entrenar una política de locomoción RL que supere al baseline MPC en terrenos irregulares y demuestre readiness para sim-to-real.

Earning criteria — what you'll demonstrate

Diseñar entrenamientos RL en simuladores paralelos modernos
Aplicar currículos de dificultad para acelerar convergencia
Usar domain randomization para mejorar transferencia sim-to-real
Evaluar políticas de control con métricas operativas, no solo recompensa

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Advanced Robotics

Master · Ai Ml

Fit score: 1

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Investigador/a Científico/a
AI Research

Research Scientist

Entrenar RL para locomoción cuadrúpeda en simulación paralela y compararla con MPC es el formato estándar de los papers recientes de RSS o CoRL en el área.

Este proyecto afina

reinforcement-learning
learning-based-control
isaac-gym

ML Researcher

Diseñar currículos y randomizaciones que generalicen es exactamente lo que entrena el reto y se espera de quien publica en RL aplicado.

Este proyecto afina

reinforcement-learning
domain-randomization
isaac-gym

AI Engineer

Llevar políticas RL a un plan creíble de despliegue en hardware es trabajo AI Engineer en robótica de campo.

Este proyecto afina

pytorch
domain-randomization
sim-to-real

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Empezar este proyecto