Plataforma de evaluación humana para LLMs en producto

FreeVerified credential6 semanasAdvanced

Visión general

De qué trata este proyecto.

Construye una plataforma web con Python y React para evaluar LLMs con tests A/B, Likert y métricas de concordancia. Obtén un certificado verificable.

CredentialBlockchain-anchored

ShareableLinkedIn-ready

LanguageEnglish

PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Construir una plataforma interna de evaluación humana para LLMs con tres tipos de evaluación, control de concordancia y exportación, lista para uso en producción interna.

Earning criteria — what you'll demonstrate

Construir herramientas internas de evaluación humana usables
Implementar cálculo de concordancia entre evaluadoras
Diseñar muestreo y asignación bloqueada para reducir sesgo
Entregar producto interno con despliegue y documentación

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

AI Software Engineering Group Project

Master · Ai Ml

Fit score: 1

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Ingeniero/a de IA
AI Engineering

Ingeniero de IA

Construir herramientas internas de evaluación humana para LLMs es trabajo directo de un AI Engineer en empresas que escalan productos generativos.

Este proyecto afina

full-stack-development
human-evaluation
software-engineering

Científico de Datos Aplicado a IA

Implementar concordancia entre evaluadoras y muestreo estratificado es palanca directa de un científico aplicado a IA en evaluación de LLMs.

Este proyecto afina

human-evaluation
model-evaluation
system-design

Diseñador de Producto de IA

Diseñar el flujo del evaluador para reducir fatiga y mejorar consistencia es ejercicio directo del rol emergente de AI Product Designer en herramientas internas.

Este proyecto afina

full-stack-development
human-evaluation
system-design

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Empezar este proyecto