Clasifica reclamaciones de seguros con un modelo de lenguaje afinado
Visión general
De qué trata este proyecto.
Recibirás 18.000 reclamaciones anonimizadas etiquetadas (urgencia 1-3, ramo en 12 categorías, flag fraude). Diseñarás el preprocesamiento de texto. Afinarás 2 modelos pre-entrenados en español (BETO y RoBERTa-bne) sobre las 3 tareas con multi-task learning o cabezas separadas. Evaluarás con macro-F1 por dimensión, calibración de confianza y análisis de errores por categoría poco representada. Entregarás notebook, comparativa, recomendación con análisis de coste de inferencia y plan de adopción gradual junto con el equipo de analistas (no reemplazo).
El Briefing
Lo que harás y lo que demostrarás.
Afinar un modelo de lenguaje en español para clasificar reclamaciones en 3 dimensiones con macro-F1 mayor a 0,80 y plan de adopción gradual.
Earning criteria — what you'll demonstrate
- Afinar modelos pre-entrenados en español sobre tareas multi-etiqueta
- Comparar arquitecturas con métricas adecuadas (macro-F1, no accuracy)
- Analizar calibración de confianza para enrutar dudas a personas analistas
- Diseñar adopción gradual respetando trabajo del equipo humano
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniera de Machine Learning
Afinar modelos pre-entrenados en español sobre tareas reales de clasificación multi-etiqueta con análisis operativo es el portafolio que las aseguradoras, fintechs y telcos latinos piden a su próxima MLE.
Este proyecto afina
- deep-learning
- transfer-learning
- nlp
Ingeniera de NLP
Una NLP engineer que ha afinado modelos en español sobre datasets reales y comparado arquitecturas se diferencia del 80 por ciento de candidatas que solo han usado APIs cerradas.
Este proyecto afina
- nlp
- deep-learning
- model-evaluation
Científica de Datos
Las científicas de datos que dominan transfer learning y calibración trabajan sobre problemas más complejos que clasificación tabular.
Este proyecto afina
- transfer-learning
- model-evaluation
- feature-engineering