Clasificador de correos de incidencia para un ayuntamiento mediano
Visión general
De qué trata este proyecto.
Recibes 12.000 correos anonimizados etiquetados en cinco categorías. Construye un pipeline de Natural Language Processing (NLP) básico (limpieza de texto, vectorización TF-IDF) y entrena al menos dos clasificadores (Naïve Bayes y regresión logística). Reporta accuracy y F1 por categoría sobre validación con división temporal. Identifica categorías con peor rendimiento y propón mejoras. Cierra con una memoria de tres páginas y un diagrama de flujo del proceso propuesto, dejando claro qué decisiones siguen siendo humanas.
El Briefing
Lo que harás y lo que demostrarás.
Construir un clasificador de correos ciudadanos en cinco categorías con un protocolo claro de uso humano-en-el-bucle.
Earning criteria — what you'll demonstrate
- Construir un pipeline básico de NLP de extremo a extremo
- Aplicar técnicas clásicas de clasificación a texto en español
- Evaluar honestamente con una división temporal
- Diseñar un flujo humano-en-el-bucle para uso prudente del clasificador
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico de Datos
Construir un pipeline básico de NLP, evaluarlo con honestidad y proponer un flujo humano-en-el-bucle es el rodaje típico de un Data Scientist junior en sector público.
Este proyecto afina
- text-classification
- nlp
- model-validation
Ingeniero de NLP
Trabajar texto en español con técnicas clásicas y diseñar el siguiente paso es el camino estándar hacia un puesto junior de NLP Engineer.
Este proyecto afina
- nlp
- text-classification
- feature-engineering
Ingeniero de Machine Learning
El diseño de un protocolo de uso prudente con umbral de confianza conecta con las primeras responsabilidades de un MLE en sectores regulados.
Este proyecto afina
- python
- human-in-the-loop
- model-validation