Optimiza el ruteo de un brazo robótico con Q-learning tabular

FreeVerified credential2 semanasIntermediate

Visión general

De qué trata este proyecto.

Discretiza el espacio de configuración de un brazo robótico y entrena Q-learning tabular para superar una heurística greedy. Obtén un certificado verificable.

CredentialBlockchain-anchored

ShareableLinkedIn-ready

LanguageEnglish

PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Aprender trayectorias eficientes en un brazo simulado con Q-learning tabular, superando a una heurística en 12 piezas distintas.

Earning criteria — what you'll demonstrate

Modelar un problema robótico como MDP (Markov Decision Process)
Aplicar Q-learning tabular con epsilon-greedy y decay
Comparar RL (Reinforcement Learning — aprendizaje por refuerzo) contra heurística
Diagnosticar cuándo el espacio de estado es demasiado grande para tabular

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Reinforcement Learning

Master · Ai Ml

Fit score: 1

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Ingeniero/a de Machine Learning
AI Engineering

Ingeniero/a de Machine Learning

Aplicar Q-learning a un problema robótico real con comparación honesta contra heurísticas es exactamente el trabajo de un MLE junior en robótica industrial.

Este proyecto afina

reinforcement-learning
q-learning
python

Científico/a Aplicado/a de IA

Modelar un MDP industrial y demostrar valor incremental sobre heurística es el día a día del applied AI scientist en robotics y manufactura.

Este proyecto afina

mdp-modeling
reinforcement-learning
evaluation

Investigador/a de Machine Learning

Analizar sample efficiency y proponer siguientes pasos (DQN, function approximation) es la franja research-oriented del MLE.

Este proyecto afina

reinforcement-learning
evaluation
simulation

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Empezar este proyecto