Clasificador de Tickets de Soporte para una SaaS de Málaga
Visión general
De qué trata este proyecto.
Recibes 40.000 tickets históricos en español con la categoría asignada por agentes humanos (con ruido conocido — la propia gerencia estima un 8% de errores de etiquetado). Limpia el texto, construye dos baselines (TF-IDF + regresión logística, TF-IDF + linear SVM) y un modelo basado en embeddings multilingües (sentence-transformers + clasificador lineal). Reporta F1 macro, F1 por clase y matriz de confusión, y entrega una nota técnica con la recomendación de qué modelo desplegar y bajo qué umbral de confianza.
El Briefing
Lo que harás y lo que demostrarás.
Entrenar un clasificador multiclase de tickets con F1 macro superior a 0,72 y definir el umbral de confianza para despliegue híbrido humano-máquina.
Earning criteria — what you'll demonstrate
- Aplicar TF-IDF y embeddings multilingües a clasificación en español
- Manejar etiquetas ruidosas y reportar su impacto
- Calibrar un umbral de confianza para despliegue híbrido
- Diferenciar métrica agregada de métrica por clase relevante
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Procesamiento de Lenguaje Natural
Construir un clasificador multiclase con embeddings multilingües y análisis de errores es el día uno de un NLP engineer junior en SaaS.
Este proyecto afina
- text-classification
- embeddings
- model-evaluation
Ingeniero de Aprendizaje Automático
El reto cubre baseline, modelo más fuerte, umbral calibrado — el flujo cotidiano de un MLE junior en producto.
Este proyecto afina
- text-classification
- feature-engineering
- model-evaluation
Científico de Datos
Manejar etiquetas ruidosas y traducir métricas en decisión de umbral es trabajo central del científico de datos en producto B2B.
Este proyecto afina
- text-classification
- data-wrangling
- model-evaluation