Diarización y resúmenes para un call center de salud en Bogotá
Visión general
De qué trata este proyecto.
Recibes 200 llamadas anonimizadas de duración media de 5 minutos. Implementa el pipeline en tres etapas: (1) diarización con pyannote.audio o un modelo equivalente, (2) transcripción con Whisper, (3) resumen estructurado con un modelo de lenguaje pequeño (por ejemplo Llama-3 8B con prompting cuidado, ejecutado localmente). Evalúa diarization error rate, WER y exactitud por campo del resumen contra etiquetas humanas en 30 llamadas de validación. Entrega también un análisis explícito de qué información del audio se elimina antes de pasar al modelo de lenguaje, por privacidad.
El Briefing
Lo que harás y lo que demostrarás.
Construir un pipeline diarización-transcripción-resumen para llamadas de salud cumpliendo restricciones de privacidad y midiendo cada etapa.
Earning criteria — what you'll demonstrate
- Integrar diarización, transcripción y resumen en un pipeline coherente
- Diseñar evaluaciones por etapa con métricas estándar
- Aplicar criterios de privacidad antes de procesamiento por modelos de lenguaje
- Razonar sobre uso local versus uso de API en datos sensibles
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de NLP
Integrar diarización, transcripción y resumen con criterios de privacidad es trabajo cotidiano de personas NLP en empresas con producto sobre datos sensibles.
Este proyecto afina
- speaker-diarization
- speech-recognition
- summarization
Ingeniero/a de IA
Empalmar tres modelos abiertos en un pipeline funcional respetando restricciones operativas es el día a día de una persona AI Engineer en productos sobre audio.
Este proyecto afina
- speech-recognition
- summarization
- pytorch
Investigador/a de Seguridad en IA
Definir y verificar qué información se elimina antes de pasar al modelo de lenguaje es habilidad central de una persona investigadora de seguridad en IA aplicada a salud.
Este proyecto afina
- privacy-preservation
- evaluation
- summarization