Defensa contra inyección de prompts en chatbot de banca
Visión general
De qué trata este proyecto.
En equipo de 2, recibes el chatbot de staging con system prompt actual, schema de funciones (consultar_saldo, transferir, etc.) y logs ofuscados. Diseña 50 ataques en 6 categorías (instrucción directa, indirecta vía contenido, role-play malicioso, jailbreaks conocidos, fuga del system prompt, manipulación de funciones). Mide la tasa de éxito de los ataques contra el chatbot base. Implementa al menos 4 capas defensivas (filtrado de entrada, system prompt endurecido, output filtering, dual LLM judge) y mide la mejora. Éxito = reducción de tasa de ataques exitosos en >= 70%, sin degradar la utilidad medida en 30 conversaciones legítimas.
El Briefing
Lo que harás y lo que demostrarás.
Reducir en >= 70% la tasa de inyección de prompts exitosa en un chatbot bancario, sin degradar utilidad legítima.
Earning criteria — what you'll demonstrate
- Catalogar y ejecutar ataques de prompt injection de forma reproducible
- Diseñar defensas multi-capa contra inyección de prompts
- Evaluar trade-off seguridad vs. utilidad de forma cuantitativa
- Comunicar riesgos de IA generativa a un comité de seguridad regulado
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de Prompts
Red-teaming sistemático y defensa multi-capa contra inyección de prompts es exactamente la franja senior del trabajo de prompt engineer en empresas reguladas.
Este proyecto afina
- prompt-engineering
- prompt-injection-defense
- evaluation
Investigador/a en Seguridad de IA
Catalogar ataques, medir mitigaciones y cuantificar trade-offs es el corazón del AI safety researcher en empresas que despliegan LLMs.
Este proyecto afina
- ai-safety
- red-teaming
- evaluation
Ingeniero/a de IA
Implementar capas defensivas en un sistema LLM en producción es trabajo cotidiano de un AI engineer en sectores regulados.
Este proyecto afina
- prompt-injection-defense
- python
- prompt-engineering