Visión general
De qué trata este proyecto.
Recibirás 800.000 transacciones etiquetadas (1,4 por ciento fraude) con features de transacción, comerciante y dispositivo. Construye y compara al menos tres enfoques: Isolation Forest no supervisado, XGBoost supervisado y un ensemble que combine ambos. Optimiza el threshold sobre una función de coste explícita (perder 1 USD de fraude vs molestar a un cliente con un falso bloqueo). Reporta precision-recall curves, lift por decil y matriz de confusión sobre datos out-of-time. El éxito significa un modelo que reduzca falsos positivos al menos 40 por ciento manteniendo recall sobre fraude en 85 por ciento o superior.
El Briefing
Lo que harás y lo que demostrarás.
Construye un detector de fraude que reduzca falsos positivos 40 por ciento manteniendo recall sobre fraude en 85 por ciento, optimizado sobre coste real.
Earning criteria — what you'll demonstrate
- Aplicar y comparar anomaly detection no supervisado vs supervisado sobre datos desbalanceados
- Optimizar threshold sobre función de coste asimétrica de negocio
- Construir features temporales y de agregación a nivel cliente y comerciante
- Comunicar trade-offs precision/recall a un comité de riesgo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico de Datos
Fraud detection con datos desbalanceados es un proyecto de portfolio fuerte que aparece en casi toda entrevista de DS en fintech.
Este proyecto afina
- anomaly-detection
- xgboost
- fraud-detection
Ingeniero de Aprendizaje Automático
Empaquetar el modelo en una API y diseñar el plan de monitoreo es el rol del MLE de fraude en cualquier fintech de tamaño medio.
Este proyecto afina
- xgboost
- evaluation
- feature-engineering
Científico Aplicado de IA
Optimizar sobre coste asimétrico real y defender el threshold ante un comité de riesgo es la habilidad central del applied AI scientist en banca y fintech.
Este proyecto afina
- cost-sensitive-learning
- evaluation
- anomaly-detection