Audita un modelo LLM por extracción de datos para una insurtech madrileña
Visión general
De qué trata este proyecto.
Recibirás el modelo fine-tuneado y muestras anonimizadas del corpus de entrenamiento. Implementa: (1) ataques de extracción membership-style con prompts diseñados para inducir respuestas literales, (2) métrica de extracción canary (insertaste secuencias sintéticas conocidas; mides si el modelo las regurgita), (3) propuestas de mitigación (deduplication del corpus, output filtering, rate limiting). Documenta hallazgos honestamente. Entrega informe de auditoría de 6 páginas firmable por cumplimiento.
El Briefing
Lo que harás y lo que demostrarás.
Auditar el riesgo de extracción de datos personales del LLM fine-tuneado y proponer mitigaciones defendibles ante AEPD.
Earning criteria — what you'll demonstrate
- Diseñar ataques de extracción sobre LLMs en producción
- Aplicar métricas canary para cuantificar memorización
- Evaluar mitigaciones prácticas con métricas honestas
- Producir auditorías firmables por cumplimiento RGPD
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador/a en Seguridad de IA
Auditar LLMs por extracción de datos personales es trabajo nuclear del AI safety researcher en sectores regulados como insurtech y banca.
Este proyecto afina
- llm-security
- data-extraction-attacks
- gdpr-compliance
Investigador/a en ML
Reproducir y aplicar ataques de extracción de la literatura es trabajo de ML researcher orientado a seguridad de modelos.
Este proyecto afina
- privacy-attacks
- data-extraction-attacks
- evaluation
Ingeniero/a de IA
Implementar mitigaciones (filtros de salida, deduplication) en pipelines de LLM es competencia del AI engineer en sistemas regulados.
Este proyecto afina
- llm-security
- python
- evaluation