Diseña un sistema de question answering para una aseguradora valenciana
Visión general
De qué trata este proyecto.
Recibirás los 3.800 documentos anonimizados más 400 preguntas anotadas con la respuesta y el span correcto. Implementa: (1) recuperador BM25 + multilingual-e5 sobre chunks de 300 tokens, (2) lector extractivo con XLM-RoBERTa-large fine-tuneado para SQuAD-style QA, (3) evaluación con Exact Match (EM) y F1 a nivel de span. El éxito es F1 >= 0,72 y EM >= 0,55. Entrega prototipo + manual de piloto para sucursales.
El Briefing
Lo que harás y lo que demostrarás.
Construir un sistema QA extractivo sobre 3.800 documentos en español con F1 >= 0,72 y EM >= 0,55, listo para piloto en 3 sucursales.
Earning criteria — what you'll demonstrate
- Aplicar arquitectura recuperador + lector a un caso real en español
- Fine-tunear un modelo extractivo de QA
- Evaluar QA con métricas estándar (EM, F1 token-level)
- Diseñar el flujo end-to-end pensando en el piloto operativo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de PLN
Construir QA extractivo en español sobre documentación corporativa es uno de los proyectos más demandados del NLP engineer en banca y seguros.
Este proyecto afina
- question-answering
- rag
- nlp-spanish
Ingeniero/a de IA
Integrar recuperador + lector + interfaz operativa es trabajo glue del AI engineer en aplicaciones corporativas.
Este proyecto afina
- rag
- python
- transformers
Ingeniero/a de Machine Learning
El fine-tuning de XLM-R-large para QA y la evaluación con EM/F1 son competencias del MLE aplicado a NLP.
Este proyecto afina
- transformers
- evaluation
- python