Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst rund 280.000 SMILES mit Bindungsaffinitaeten gegen eine GPCR-Klasse. Trainiere einen Sequence-VAE (z. B. nach Gomez-Bombarelli 2018) mit 64-dimensionalem Latentraum. Bewerte: (1) Rekonstruktionsrate gueltiger SMILES, (2) Glattheit des Latentraums per Nachbarschafts-Hit-Anreicherung, (3) Generations-Qualitaet (Anteil gueltiger, neuartiger, synthetisch zugaenglicher Molekuele). Vergleiche gegen einen reinen Autoencoder ohne KL-Regularisierung. Liefere eine Notebook-basierte Pipeline plus eine wissenschaftliche Notiz, die Modellannahmen und Limitationen ehrlich beschreibt.
Das Briefing
Was Du tust und was Du zeigst.
Lerne mit einem Sequence-VAE einen glatten Latentraum ueber SMILES und nutze ihn zur Generierung von Kandidaten in der Naehe bekannter Hits.
Earning criteria — what you'll demonstrate
- Variational Autoencoder als latente Generative Models verstehen und implementieren
- ELBO-Loss mit KL-Annealing kontrolliert trainieren
- Latentraum-Qualitaet mit aufgaben-spezifischen Metriken bewerten
- Generative Modelle in einer regulierten Forschungs-Domaene argumentativ einordnen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenML Researcher
Einen Sequence-VAE auf einem realen Pharma-Datensatz zu trainieren, sauber zu evaluieren und gegen Baselines zu argumentieren ist die Standardarbeit eines Junior-ML-Researchers in einer Pharma-Cheminformatik-Gruppe.
Dieses Projekt schärft
- variational-autoencoders
- generative-models
- latent-space-analysis
Applied AI Scientist
Variational Inference und VAE-Training auf einer regulierten, hochwertigen Domaene anzuwenden und Forschungsergebnisse einer wissenschaftlichen Gruppe aufzubereiten ist klassische Applied-AI-Arbeit.
Dieses Projekt schärft
- variational-inference
- variational-autoencoders
- cheminformatics
Research Scientist
Generative Modelle gegen aufgaben-spezifische Validitaets- und Neuartigkeitsmetriken zu validieren und ehrlich Limitationen zu beschreiben ist Kerngebiet wissenschaftlicher Forschung.
Dieses Projekt schärft
- generative-models
- latent-space-analysis
- pytorch
Noch eine Sache