Variant-Calling-Pipeline für ein Penzberger Pharmaunternehmen
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst eine Spezifikation der Soll-Pipeline (FASTQ-QC mit FastQC, Alignment mit BWA-MEM, Duplikat-Markierung, Variant-Calling mit GATK HaplotypeCaller, Filterung, Annotation mit VEP — Variant Effect Predictor) und Zugriff auf öffentliche 1000-Genomes-Subset-Daten. Implementiere die Pipeline als Snakemake- oder Nextflow-Workflow mit conda-Environments, schreibe einen Test-Modus mit Mini-Daten (5 Minuten Laufzeit) und einen vollen Lauf (rund 90 Minuten). Validiere die Variant-Call-Liste gegen den 1000-Genomes-Truth-Set. Liefere das Repository, einen 6-seitigen Methodenbericht, eine Reproduzierbarkeits-Anleitung und eine 20-minütige Übergabesession an das Bioinformatik-Team.
Das Briefing
Was Du tust und was Du zeigst.
Wie lässt sich eine moderne, reproduzierbare Variant-Calling-Pipeline so aufbauen, dass sie zwischen Standorten identische Ergebnisse liefert und in unter 90 Minuten auf öffentlichen Beispieldaten läuft?
Earning criteria — what you'll demonstrate
- Eine vollständige Variant-Calling-Pipeline auf einer realen Datenquelle entwerfen
- Reproduzierbarkeit über conda und Container praktisch umsetzen
- Truth-Set-Vergleiche und Confusion-Matrix-Metriken (Precision, Recall) interpretieren
- Workflow-Management-Werkzeuge für mehrstufige Bioinformatik-Pipelines wählen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenSoftware Engineer
Bioinformatik-Pipelines sind ein wachsendes Anwendungsfeld für Software Engineers in Pharma und Forschung. Reproduzierbarkeit und Workflow-Management lassen sich auf jede mehrstufige Datenpipeline übertragen.
Dieses Projekt schärft
- bioinformatics
- workflow-management
- reproducibility
Noch eine Sache