Ataques adversariales y entrenamiento robusto para clasificador de fraude
Visión general
De qué trata este proyecto.
Recibes el modelo del cliente (pesos), su dataset de transacciones anonimizado y permiso explícito para evaluar adversarialmente. Aplica al menos tres ataques (Fast Gradient Sign Method, Projected Gradient Descent, Carlini-Wagner) sobre el modelo original y reporta la degradación de la métrica F1 por intensidad de perturbación. Aplica entrenamiento adversarial (PGD-AT) y mide ganancia de robustez vs. pérdida de exactitud en datos limpios. El éxito es demostrar el riesgo cuantitativamente y entregar una versión robusta defendible.
El Briefing
Lo que harás y lo que demostrarás.
Cuantificar el riesgo adversarial de un clasificador de fraude y entregar una versión robusta con análisis de trade-off.
Earning criteria — what you'll demonstrate
- Aplicar ataques adversariales clásicos en caja blanca
- Implementar entrenamiento adversarial proyectado
- Cuantificar trade-off robustez vs. exactitud limpia
- Comunicar riesgo de seguridad a clientes no técnicos
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador/a de Seguridad en IA
Ejecutar ataques adversariales, entrenamiento robusto y traducirlo a informe para clientes es perfil central de personas investigadoras de seguridad en consultoría de IA.
Este proyecto afina
- adversarial-attacks
- adversarial-training
- robustness-testing
Científico/a Aplicado/a de IA
Trasladar técnicas de seguridad de IA al contexto de un cliente y argumentar trade-offs es trabajo cotidiano de investigación aplicada en consultoría.
Este proyecto afina
- security-analysis
- adversarial-training
- evaluation
Ingeniero/a de Aprendizaje Automático
Empaquetar un modelo robustecido y documentar su evaluación es el patrón con el que MLEs entregan sistemas hardened en sectores regulados.
Este proyecto afina
- pytorch
- evaluation
- robustness-testing