Predicción de propiedades moleculares para una farma española
Visión general
De qué trata este proyecto.
Recibes una versión limpia de los conjuntos públicos ESOL (solubilidad acuosa) y PAMPA (permeabilidad) más una API simple para convertir SMILES en grafos moleculares. Implementa una GNN básica (por ejemplo Graph Convolutional Network) en PyTorch Geometric y entrena un modelo por propiedad. Compara contra una base de fingerprints de Morgan con random forest. Reporta error medio absoluto, gráfico de paridad y análisis de error por familia química. Cierra con una memoria de tres páginas que recomiende si el modelo es lo suficientemente fiable para usarse como filtro temprano antes de síntesis.
El Briefing
Lo que harás y lo que demostrarás.
Entrenar y evaluar un modelo gráfico para predecir solubilidad y permeabilidad de moléculas y decidir si es apto para uso como filtro temprano de cribado.
Earning criteria — what you'll demonstrate
- Aplicar GNNs a representación de moléculas como grafos
- Diseñar splits que respeten la diversidad química (scaffold split)
- Evaluar modelos con métricas relevantes para Química Médica
- Comunicar limitaciones a una audiencia no ML del área de I+D
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador de Machine Learning
Implementar y evaluar una GNN con splits que respetan la estructura química y análisis de error por familia es trabajo directo de un ML Researcher en descubrimiento de fármacos.
Este proyecto afina
- graph-neural-networks
- model-validation
- scientific-computing
Científico de Datos Aplicado a IA
Decidir si un modelo merece pasar a uso como filtro temprano implica el criterio aplicado que distingue al rol dentro de un laboratorio farmacéutico.
Este proyecto afina
- pytorch
- cheminformatics
- model-validation
Ingeniero de Machine Learning
El siguiente paso natural sería empaquetar el modelo en una API consumible por el equipo de Química Médica — el pipeline limpio ya construido facilita ese salto.
Este proyecto afina
- pytorch
- graph-neural-networks
- feature-engineering