Construye un modelo de extracción de información para una aseguradora bilbaína
Visión general
De qué trata este proyecto.
Recibirás 2.500 partes anonimizados con 1.200 anotados con entidades de dominio. Implementa: (1) NER base con BETO fine-tuned, (2) NER mejorado con XLM-RoBERTa-large fine-tuned, (3) reglas regex de validación post-modelo (fechas, matrículas, importes). Evalúa F1 por entidad con intervalos de confianza. El éxito es F1 macro >= 0,88 y F1 por entidad crítica (lesionados, importe) >= 0,90. Entrega prototipo + manual de operación.
El Briefing
Lo que harás y lo que demostrarás.
Construir un sistema NER para partes de siniestros con F1 macro >= 0,88 y F1 por entidad crítica >= 0,90, listo para piloto.
Earning criteria — what you'll demonstrate
- Aplicar NER moderno a un dominio especializado en español
- Combinar deep learning con reglas para extracción robusta
- Evaluar NER con F1 por entidad y análisis de errores
- Diseñar un sistema listo para piloto con manual operativo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de PLN
Construir NER de dominio en español es uno de los trabajos más demandados del NLP engineer en seguros, banca y legal.
Este proyecto afina
- named-entity-recognition
- nlp-spanish
- transformers
Ingeniero/a de Machine Learning
El fine-tuning de XLM-R y la combinación con reglas es competencia del MLE aplicado a NLP en producción.
Este proyecto afina
- transformers
- domain-adaptation
- evaluation
Ingeniero/a de IA
Empaquetar el modelo + reglas + manual operativo es trabajo del AI engineer que cierra el ciclo de prototipo a piloto.
Este proyecto afina
- python
- named-entity-recognition
- domain-adaptation