Visión general
De qué trata este proyecto.
Recibes un corpus de 12.000 PDFs ya convertidos a texto (200k passages tras chunking), 200 preguntas reales de ingenieros con la respuesta-oro y el span exacto del documento de origen. Implementa un pipeline en dos etapas: (1) retrieval con BM25 sobre los passages, (2) reading comprehension con un modelo QA extractivo (XLM-RoBERTa fine-tuned o un LLM con prompt extractivo). Evalúa con Exact Match (EM) y F1 a nivel de span, más recall@5 del retrieval. Éxito = F1 >= 0,65, 100% de respuestas con span verificable y latencia p95 < 3s.
El Briefing
Lo que harás y lo que demostrarás.
Construir un QA extractivo multilingüe sobre 12k manuales con citación obligatoria y F1 >= 0,65.
Earning criteria — what you'll demonstrate
- Implementar un pipeline retrieve-then-read para QA extractivo
- Comparar BM25 con retrieval denso y elegir según costo/beneficio
- Evaluar QA con métricas estándar (EM, F1, recall@k)
- Garantizar trazabilidad obligatoria (span verificable) en respuestas generadas
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de NLP
Construir un pipeline QA multilingüe sobre documentación técnica corporativa es trabajo central del NLP engineer en industria y manufactura.
Este proyecto afina
- question-answering
- information-retrieval
- multilingual-nlp
Ingeniero/a de IA
Empaquetar un sistema QA con trazabilidad obligatoria y demo para integración interna es la rutina del AI engineer en empresas industriales.
Este proyecto afina
- question-answering
- python
- reading-comprehension
Ingeniero/a de Machine Learning
Manejar modelos QA fine-tuneables, evaluación rigurosa y reproducibilidad es el día a día del MLE en NLP enterprise.
Este proyecto afina
- question-answering
- evaluation
- python