Genera resúmenes visuales de partidos para un medio deportivo mexicano
Visión general
De qué trata este proyecto.
Recibirás 30 partidos completos anotados con timestamps de eventos (gol, tiro, falta, sustitución, tarjeta). Entrena un modelo de detección de eventos basado en un encoder visual preentrenado (CLIP o SlowFast) + cabeza de clasificación temporal. Implementa post-processing (non-maximum suppression temporal) para limpiar predicciones redundantes. Construye un pipeline que reciba un video y produzca un timeline + clips de 15 segundos por evento. Valida con 5 editores: tiempo ahorrado y precision de los eventos sugeridos. Entrega notebook + pipeline + reporte de validación.
El Briefing
Lo que harás y lo que demostrarás.
Construye un detector de eventos de fútbol que reduzca el tiempo de edición de highlights de 90 a 30 minutos por partido.
Earning criteria — what you'll demonstrate
- Aplicar encoders visuales preentrenados (CLIP, SlowFast) a video deportivo
- Implementar temporal action detection con post-processing apropiado
- Diseñar pipelines de video que orquesten extracción de frames + inferencia + clipping
- Validar mejoras de productividad con usuarios reales, no benchmarks sintéticos
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Visión por Computador
Video understanding aplicado a deportes es nicho con demanda alta en medios y streaming.
Este proyecto afina
- video-understanding
- temporal-action-detection
- clip
Ingeniero de IA
Empaquetar el modelo en un pipeline operacional con FFmpeg y validación humana es trabajo cotidiano del AI engineer.
Este proyecto afina
- pipeline-design
- pytorch
- clip
Ingeniero de Aprendizaje Automático
Conectar inferencia + post-processing + entrega editorial es la cadena del MLE en producto creativo.
Este proyecto afina
- video-understanding
- pipeline-design
- evaluation