Razonamiento visual para auditar etiquetado vial en delivery autónomo

FreeVerified credential3 semanasAdvanced

Visión general

De qué trata este proyecto.

Construye un sistema VQA afinando un MLLM con LoRA sobre 800 imágenes de delivery autónomo. Mides exactitud, latencia y fallos. Obtienes un certificado verificable.

CredentialBlockchain-anchored

ShareableLinkedIn-ready

LanguageEnglish

PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Construir un sistema de Visual Question Answering capaz de responder 12 preguntas de seguridad vial sobre la vista frontal de un robot de reparto, con exactitud superior al 78% y latencia inferior a 1,5 segundos.

Earning criteria — what you'll demonstrate

Aplicar Modelos de Lenguaje Multimodales Grandes (MLLM) a tareas de razonamiento visual
Afinar un modelo grande con LoRA bajo restricciones de memoria de GPU
Evaluar VQA con exactitud por pregunta más análisis cualitativo de fallos
Conectar la percepción robótica con razonamiento de alto nivel en lenguaje natural

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Visual Intelligence and Visual Reasoning

Master · Ai Ml

Fit score: 1

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Ingeniero/a de Visión por Computador
AI Engineering

Computer Vision Engineer

Conectar percepción robótica con razonamiento visual multimodal es exactamente la siguiente generación de trabajo CV que las empresas de autónomos demandan; este reto entrega un proyecto completo para mostrar en entrevistas.

Este proyecto afina

visual-question-answering
scene-understanding
model-evaluation

Applied AI Scientist

Afinar un MLLM con LoRA sobre un dataset propio y reportar exactitud más fallos accionables es el día a día de una persona Applied AI Scientist en una startup de autónomos o de IA física.

Este proyecto afina

lora-fine-tuning
multimodal-llm
model-evaluation

Machine Learning Engineer

Servir un MLLM con presupuesto de latencia en GPU y reproducibilidad estricta refleja cómo los MLEs ponen modelos multimodales en producción.

Este proyecto afina

pytorch
multimodal-llm
model-evaluation

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Empezar este proyecto