Visión general
De qué trata este proyecto.
Recibirás 3.000 redacciones del semestre anterior con rúbrica humana detallada (5 criterios x escala 1-5) y dos rúbricas independientes para validar inter-rater reliability humana. Diseñarás un sistema (puede ser ensemble: LLM + clasificadores tradicionales) que prediga el score por criterio y genere comentarios accionables. Evaluarás (a) correlación con humano (QWK — Quadratic Weighted Kappa — por criterio), (b) sesgo por género/origen socioeconómico, (c) utilidad de los comentarios juzgada por 5 docentes sobre 50 redacciones. El éxito es QWK promedio >= 0,75 (cerca del inter-rater humano) sin sesgo significativo y comentarios útiles según docentes.
El Briefing
Lo que harás y lo que demostrarás.
Construir un sistema de evaluación automática de redacciones argumentativas con correlación cercana al inter-rater humano, sin sesgo y con comentarios útiles según docentes.
Earning criteria — what you'll demonstrate
- Aplicar NLP moderno a scoring automático de texto largo
- Combinar LLM y clasificadores tradicionales en ensemble interpretable
- Auditar sesgo en scoring automático con metodología rigurosa
- Diseñar evaluación cualitativa con docentes humanos
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosApplied AI Scientist
Trabajar con NLP educativo, auditar sesgo y validar con docentes es lo que define al rol Applied AI Scientist en EdTech universitario.
Este proyecto afina
- automated-essay-scoring
- nlp
- bias-auditing
NLP Engineer
Combinar LLMs con clasificadores tradicionales para scoring de texto largo es trabajo NLP Engineer típico en producto educativo.
Este proyecto afina
- nlp
- llm-evaluation
- python
Investigador en Seguridad de IA
Auditar sesgo en sistemas que afectan calificaciones de estudiantes es responsabilidad directa de AI Safety Researcher aplicado.
Este proyecto afina
- bias-auditing
- human-in-the-loop
- llm-evaluation