Aprendizaje por demostración para tareas de pick-and-place
Visión general
De qué trata este proyecto.
Trabajarás en simulación (Isaac Gym o PyBullet) con un brazo Franka Panda o equivalente. Diseña un flujo donde el técnico graba 5 demostraciones de una tarea de pick-and-place. Implementa una política aprendida usando Behavior Cloning o un método más reciente como Diffusion Policy. Evalúa la política sobre 20 ejecuciones variando ligeramente la posición inicial del objeto y mide tasa de éxito, tiempo medio de ejecución y robustez a perturbaciones (objeto desplazado 5 cm). El éxito es tasa de éxito ≥ 85 % con 5 demostraciones.
El Briefing
Lo que harás y lo que demostrarás.
Construir un sistema de aprendizaje por demostración que permita generalizar tareas de pick-and-place a partir de pocas demostraciones.
Earning criteria — what you'll demonstrate
- Aplicar aprendizaje por imitación a tareas de manipulación robótica
- Diseñar evaluaciones que cubran variabilidad realista del entorno
- Comparar Behavior Cloning con métodos más recientes
- Diagnosticar fallos de generalización
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Investigador/a de Aprendizaje Automático
Aplicar métodos recientes de aprendizaje por imitación a un problema de manipulación, con evaluación rigurosa, es el tipo de proyecto que abre las puertas a roles de investigación aplicada en robótica.
Este proyecto afina
- imitation-learning
- behavior-cloning
- robot-manipulation
Científico/a Aplicado/a de IA
El énfasis en demostraciones reales y evaluación bajo perturbaciones refleja el día a día de aplicar IA a tareas físicas en empresas de robótica.
Este proyecto afina
- imitation-learning
- evaluation
- simulation
Ingeniero/a de Aprendizaje Automático
Empaquetar una política aprendida con evaluación reproducible y código limpio es el patrón que MLEs siguen al entregar modelos a equipos de producto.
Este proyecto afina
- pytorch
- simulation
- evaluation