Genera mamografías sintéticas para balancear datasets en biotech catalana
Visión general
De qué trata este proyecto.
Trabajen en equipo de 2. Reciben 18.000 mamografías reales (1.500 positivas, 16.500 negativas) con BI-RADS scoring. Entrenen un Stable Diffusion 1.5 con LoRA condicionado en BI-RADS sobre las 1.500 positivas. Generen 3.000 sintéticas positivas. Entrenen un detector (EfficientNet-B0) en dos condiciones: (a) solo reales, (b) reales + sintéticas. Evalúen en un holdout 100 % real de 2.000 imágenes con AUC y sensibilidad@90 %-especificidad. Éxito: (b) supera (a) ≥3 puntos AUC sin introducir artefactos clínicamente visibles.
El Briefing
Lo que harás y lo que demostrarás.
Demostrar si mamografías sintéticas generadas por difusión mejoran un detector sin introducir artefactos clínicamente visibles.
Earning criteria — what you'll demonstrate
- Fine-tunear modelos de difusión para dominio médico con LoRA
- Evaluar utilidad de datos sintéticos para detección médica
- Diseñar splits estrictos (holdout 100 % real) para validar el efecto
- Reconocer y comunicar artefactos generativos en contexto clínico
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador/a de Machine Learning
Datos sintéticos médicos con validación downstream es área de research activa con alta demanda.
Este proyecto afina
- generative-models
- synthetic-data
- stable-diffusion
Ingeniero/a de Visión por Computador
Combinar generación y detección con métricas clínicas es habilidad creciente en CV médica.
Este proyecto afina
- generative-models
- medical-imaging
- synthetic-data
Científico/a de IA Aplicada
Demostrar mejora regulatoriamente defendible es la mentalidad de aplicación del rol en biotech.
Este proyecto afina
- synthetic-data
- medical-imaging
- lora-fine-tuning