Crea voces sintéticas de doblaje con TTS para una productora audiovisual
Visión general
De qué trata este proyecto.
Recibirás 30 minutos de grabación por cada uno de 3 locutores (sintético / con consentimiento simulado) más 50 frases de evaluación cubriendo distintos registros (informativo, narrativo, instructivo). Entrena/fine-tunea 2 sistemas TTS (XTTS v2 y un alternativo como StyleTTS2). Evalúa con: (1) MOS (Mean Opinion Score — puntaje medio de opinión) en blind listening test con 10 oyentes, (2) similaridad de speaker (cosine sobre embeddings), (3) WER (Word Error Rate — tasa de error de palabra) sobre el ASR del output. Diseña además guidelines éticas: consentimiento explícito, watermarking, casos de uso prohibidos. Entrega notebooks + samples + guidelines.
El Briefing
Lo que harás y lo que demostrarás.
Compara dos TTS generativos sobre voces consentidas y entrega guidelines éticas defendibles para uso comercial.
Earning criteria — what you'll demonstrate
- Aplicar fine-tuning de TTS generativos con datasets pequeños
- Evaluar audio generativo combinando métricas objetivas y subjetivas
- Diseñar protocolos de blind listening test estadísticamente válidos
- Producir guidelines éticas que cubran riesgos reales, no solo retórica
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador de ML
Voice cloning + evaluación combinada es un nicho con demanda creciente en media y juegos; el reto da portfolio diferenciado.
Este proyecto afina
- text-to-speech
- voice-cloning
- generative-models
Investigador de Seguridad en IA
Producir guidelines éticas operativas con watermarking y plan de incidentes es trabajo central del AI safety researcher en generative AI.
Este proyecto afina
- ai-ethics
- voice-cloning
- evaluation
Científico Aplicado de IA
Pasar de research a guideline operacional es la cadena que el applied AI scientist domina.
Este proyecto afina
- evaluation
- text-to-speech
- ai-ethics