Construye una pipeline seq2seq para corrección automática de texto en una EdTech
Visión general
De qué trata este proyecto.
Recibirás 22.000 pares (texto con errores → texto corregido) en español neutro de redacciones estudiantiles. Implementa: (1) baseline con reglas + LanguageTool, (2) fine-tuning de mT5-base sobre los pares, (3) evaluación con GLEU (Generalized BLEU para corrección gramatical) y precisión/recall a nivel de edición. Para el piloto, construye una interfaz Streamlit donde el profesor puede aceptar o rechazar sugerencias. Entrega prototipo + informe para el equipo pedagógico.
El Briefing
Lo que harás y lo que demostrarás.
Construir una pipeline seq2seq de corrección automática en español con GLEU competitivo y precisión >= 0,85 a nivel de edición.
Earning criteria — what you'll demonstrate
- Aplicar fine-tuning de modelos seq2seq a un caso real
- Evaluar corrección gramatical con métricas adecuadas (no solo BLEU)
- Comparar enfoque basado en reglas vs. neural honestamente
- Diseñar una interfaz human-in-the-loop (humano-en-el-bucle) usable
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de PLN
Construir pipelines seq2seq para corrección gramatical es una competencia muy demandada del NLP engineer en EdTech y herramientas de escritura.
Este proyecto afina
- seq2seq
- transformers
- nlp-spanish
Ingeniero/a de Machine Learning
Fine-tunear mT5 y evaluar con métricas no triviales es trabajo del MLE aplicado a NLP en producto.
Este proyecto afina
- fine-tuning
- evaluation
- python
Ingeniero/a de IA
Empaquetar el modelo en una interfaz human-in-the-loop usable es trabajo del AI engineer que cierra de prototipo a piloto.
Este proyecto afina
- python
- seq2seq
- evaluation