Detección de intención por voz para un asistente de hogar inteligente
Visión general
De qué trata este proyecto.
Recibes un dataset interno de 22.000 enunciados de comandos de hogar (encender luces, ajustar termostato, reproducir música) etiquetados con intención y entidades, más una división de prueba de 3.000 enunciados. Implementa un modelo end-to-end (por ejemplo SpeechT5 fine-tuneado para clasificación + extracción, o un encoder Wav2Vec2 con cabezas de tarea) y compáralo con la cascada Whisper + un modelo de comprensión del lenguaje natural. Mide F1 de intención, F1 de entidades y latencia. El éxito es F1 combinado >= 5 puntos sobre la cascada con latencia comparable.
El Briefing
Lo que harás y lo que demostrarás.
Comparar un modelo end-to-end de Spoken Language Understanding frente a la cascada actual en intención, entidades y latencia.
Earning criteria — what you'll demonstrate
- Diseñar y entrenar modelos end-to-end de Spoken Language Understanding
- Comparar arquitecturas en cascada y end-to-end con métricas honestas
- Diagnosticar dónde cada arquitectura supera a la otra
- Razonar sobre latencia de inferencia para dispositivos de hogar
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de NLP
Comparar cascadas y end-to-end en Spoken Language Understanding es trabajo cotidiano de una persona NLP en productos de voz para hogar.
Este proyecto afina
- spoken-language-understanding
- intent-classification
- entity-extraction
Ingeniero/a de Aprendizaje Automático
Argumentar trade-offs entre arquitecturas con métricas operativas y planificar despliegue es el patrón de una persona MLE en producto de consumo.
Este proyecto afina
- evaluation
- pytorch
- speech-recognition
Ingeniero/a de IA
Integrar modelos en pipelines de baja latencia para dispositivos de hogar es trabajo de una persona AI Engineer en empresas de electrónica de consumo.
Este proyecto afina
- pytorch
- speech-recognition
- intent-classification