Fine-tunea un transformer para clasificación legal en una LegalTech madrileña
Visión general
De qué trata este proyecto.
Recibirás 18.000 cláusulas anotadas con 24 categorías. Implementa: (1) baseline TF-IDF + regresión logística, (2) fine-tuning de XLM-RoBERTa-large, (3) técnicas de regularización (early stopping, learning rate warmup, weight decay). Evalúa F1 macro con intervalos bootstrap, F1 por categoría, y un análisis de las 5 categorías peor desempeñadas. El éxito es F1 macro >= 0,86 con análisis claro de los modos de fallo. Entrega modelo + cuaderno + informe de 4 páginas.
El Briefing
Lo que harás y lo que demostrarás.
Construir un clasificador de cláusulas legales con F1 macro >= 0,86 sobre 24 categorías y análisis claro de modos de fallo.
Earning criteria — what you'll demonstrate
- Aplicar fine-tuning de transformers grandes con técnicas modernas de regularización
- Comparar baseline clásico vs. neural honestamente
- Evaluar clasificación multiclase con métricas e intervalos defendibles
- Diagnosticar modos de fallo en clasificación de texto especializado
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de PLN
Fine-tunear transformers para clasificación de dominio es competencia central del NLP engineer en LegalTech y otras verticales especializadas.
Este proyecto afina
- transformers
- fine-tuning
- text-classification
Ingeniero/a de Machine Learning
La comparación rigurosa baseline vs. neural y los intervalos bootstrap son competencias del MLE aplicado a NLP.
Este proyecto afina
- fine-tuning
- evaluation
- python
Científico/a Aplicado/a de IA
Diagnosticar modos de fallo y comunicarlos al producto es trabajo del applied AI scientist en startups verticales.
Este proyecto afina
- evaluation
- text-classification
- nlp-spanish