Evaluación adversarial de un agente con herramientas peligrosas

FreeVerified credential3 semanasAdvanced

Visión general

De qué trata este proyecto.

Construye 200 ataques de jailbreak a un agente de IA, ejecuta un red-team y clasifica 15 vulnerabilidades. Obtén tu certificado verificable.

CredentialBlockchain-anchored

ShareableLinkedIn-ready

LanguageEnglish

PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Construir una suite de red-teaming automatizada y manual sobre un agente con herramientas peligrosas y entregar un informe de severidad con mitigaciones.

Earning criteria — what you'll demonstrate

Diseñar ataques sistemáticos contra agentes con tool use
Distinguir vulnerabilidades severidad alta vs. severidad baja con criterios claros
Combinar evaluación automática y manual de forma complementaria
Comunicar riesgos a un comité de seguridad con lenguaje accionable

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

AI Agents and LLM-Based Agents

Master · Ai Ml

Fit score: 1

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Investigador/a de Seguridad en IA
AI Research

Investigador en Seguridad de IA

Red-teaming sistemático con clasificación de severidad y mitigaciones es el oficio nuclear de quien ejerce de AI Safety Researcher en producto.

Este proyecto afina

red-teaming
agent-safety
adversarial-evaluation

AI Engineer

Cualquier AI Engineer que despliegue agentes con herramientas peligrosas necesita haber pasado por este ejercicio antes de release.

Este proyecto afina

llm-agents
agent-safety
python

Prompt Engineer

Diseñar prompts agresores y mitigaciones a nivel sistema es trabajo Prompt Engineer aplicado a seguridad.

Este proyecto afina

prompt-injection
adversarial-evaluation
llm-agents

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Empezar este proyecto