Evaluación sistemática de prompts para extracción multilingüe
Visión general
De qué trata este proyecto.
Recibes 2.000 reseñas reales anonimizadas (1.200 ES + 800 PT) con 6 atributos etiquetados (sentimiento, defecto reportado, talla, color, categoría, recomendación). Diseña un framework Python que tome una lista de variantes de prompt y produzca un reporte HTML con métricas por atributo, por idioma y por variante. Compara 4 variantes: (1) base, (2) +few-shot, (3) +CoT, (4) +schema JSON estricto. Éxito = framework reutilizable (instalable con pip), reporte claro, y una variante ganadora identificada con análisis estadístico (test de McNemar entre variantes).
El Briefing
Lo que harás y lo que demostrarás.
Construir un framework reutilizable de evaluación de prompts ES/PT y aplicarlo a una extracción real de 6 atributos sobre reseñas.
Earning criteria — what you'll demonstrate
- Construir frameworks reutilizables de evaluación de prompts
- Comparar variantes de prompting (few-shot, CoT, structured) sistemáticamente
- Aplicar tests estadísticos pareados para comparar modelos sobre los mismos ítems
- Manejar evaluación multilingüe sin sesgos por idioma
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de Prompts
Construir un framework de evaluación reusable y aplicar tests estadísticos rigurosos eleva el rol de prompt engineer de artesanal a ingeniería seria — exactamente el perfil que buscan consultorías AI.
Este proyecto afina
- prompt-engineering
- evaluation
- experiment-design
Ingeniero/a de NLP
La extracción multilingüe ES/PT con métricas por idioma es competencia central del NLP engineer en empresas latinoamericanas e ibéricas.
Este proyecto afina
- multilingual-nlp
- structured-outputs
- evaluation
Ingeniero/a de IA
Empaquetar un proceso como paquete Python testeado y documentado es la disciplina de software esperada de un AI engineer senior.
Este proyecto afina
- python
- prompt-engineering
- evaluation