Imitation Learning para Sim-to-Real en Robot Móvil de Curitiba
Visión general
De qué trata este proyecto.
Recibirás 200 demostraciones humanas teleoperadas (joystick) en simulador, más un wrapper Gymnasium del mismo entorno. Entrena un agente con Behaviour Cloning (BC) puro, luego con DAgger (Dataset Aggregation), y por último con un fine-tuning por refuerzo de pocos pasos. Diseña el protocolo sim-to-real (no necesitas correrlo en robot real): qué se randomiza, qué métricas se miden en sim antes del salto, qué criterio de detención. Entrega un informe con tabla comparativa, plan sim-to-real y una recomendación clara.
El Briefing
Lo que harás y lo que demostrarás.
Compara Behaviour Cloning, DAgger y fine-tuning por refuerzo para navegación de AGV y diseña el protocolo sim-to-real correspondiente.
Earning criteria — what you'll demonstrate
- Implementar Behaviour Cloning con demostraciones humanas reales
- Aplicar DAgger para mitigar el shift de distribución del BC puro
- Diseñar un protocolo de transferencia simulación-a-real responsable
- Comparar métodos de aprendizaje por imitación frente a fine-tuning por refuerzo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico en IA Aplicada
Comparar familias de métodos y proponer un plan sim-to-real es la rutina del Applied AI Scientist en robótica industrial.
Este proyecto afina
- imitation-learning
- sim-to-real
- behaviour-cloning
Ingeniero en Aprendizaje Automático
Implementar y comparar tres pipelines reproducibles desarrolla el músculo de MLE que ejecuta en robótica móvil.
Este proyecto afina
- pytorch
- behaviour-cloning
- reinforcement-learning
Investigador en Seguridad de IA
El plan sim-to-real con criterios de aborto entrena el reflejo de gobernanza que se le pide a un AI Safety Researcher.
Este proyecto afina
- sim-to-real
- imitation-learning
- dagger