Investiga ataques de model inversion sobre un modelo de salud anonimizado
Visión general
De qué trata este proyecto.
Recibirás un modelo de clasificación de imágenes médicas (ResNet-50 fine-tuneado) y el dataset de entrenamiento anonimizado. Implementa: (1) ataque de model inversion (Fredrikson 2015 style) para reconstruir imágenes promedio por clase, (2) ataque de membership inference (¿esta imagen estuvo en el train?), (3) defensa con DP-SGD y mide cómo cambia la vulnerabilidad. Documenta hallazgos con honestidad: si el modelo es vulnerable, dilo. Entrega informe de research de 6 páginas.
El Briefing
Lo que harás y lo que demostrarás.
Cuantificar la vulnerabilidad del modelo de diagnóstico a model inversion y membership inference, y evaluar DP-SGD como defensa.
Earning criteria — what you'll demonstrate
- Implementar ataques de privacidad clásicos sobre un modelo real
- Cuantificar vulnerabilidad de modelos a inferencia sobre datos de entrenamiento
- Evaluar DP-SGD como defensa práctica con métricas honestas
- Producir informe de research que un comité de ética pueda usar
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador/a en Seguridad de IA
Auditar modelos con ataques de inversion y membership inference es trabajo nuclear del AI safety researcher en salud y sectores sensibles.
Este proyecto afina
- model-inversion
- membership-inference
- privacy-attacks
Investigador/a en ML
Reproducir y extender ataques de privacidad de la literatura es trabajo de ML researcher orientado a seguridad.
Este proyecto afina
- privacy-attacks
- pytorch
- python
Científico/a de Investigación
Producir research honesto sobre vulnerabilidades, útil para un comité de ética, es exactamente el trabajo de un research scientist en privacidad aplicada.
Este proyecto afina
- differential-privacy
- privacy-attacks
- model-inversion