Construye un modelo seq2seq para subtitular vídeos cortos de moda
Visión general
De qué trata este proyecto.
Recibes 800 vídeos cortos en español castellano (15-60 s) con subtítulos de referencia en portugués brasileño. Construye un pipeline: Whisper-medium → mBART o NLLB-200 (No Language Left Behind — ningún idioma queda atrás). Genera subtítulos en portugués brasileño, mide BLEU y chrF (character F-score) contra referencia. Realiza evaluación humana sobre 50 vídeos con 3 evaluadores nativos en escala MQM (Multidimensional Quality Metrics — métricas de calidad multidimensionales). Éxito: BLEU ≥28 y aceptabilidad humana ≥75 %.
El Briefing
Lo que harás y lo que demostrarás.
Construir un pipeline ASR + traducción ES→PT-BR sobre vídeos cortos con BLEU ≥28 y aceptabilidad humana ≥75 %.
Earning criteria — what you'll demonstrate
- Combinar dos modelos seq2seq en un pipeline multimodal
- Distinguir métricas automáticas y humanas de calidad de traducción
- Diseñar y conducir una evaluación humana con MQM
- Diagnosticar errores en el límite ASR-MT
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de Procesamiento de Lenguaje Natural
ASR + MT en pipeline multimodal es uno de los casos centrales de NLP en producto multimedia.
Este proyecto afina
- sequence-to-sequence
- machine-translation
- speech-recognition
Ingeniero/a de IA
Encadenar dos modelos open-source y validarlos con humanos es la rutina del AI engineer en multimedia.
Este proyecto afina
- multimodal
- speech-recognition
- machine-translation
Investigador/a de Machine Learning
Diseñar evaluación humana con MQM y reportar kappa es rigor metodológico esperado en research aplicada.
Este proyecto afina
- human-evaluation
- sequence-to-sequence
- machine-translation