EHR-basierte Phaenotypisierung fuer ein Basler Pharma-Forschungsteam
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst rund 250 000 anonymisierte Patient:innen-EHRs mit ICD-10-Codes, Labor-Werten, Medikamenten-Verschreibungen ueber 5 Jahre. Die klinische Forschung hat eine 4-Kriterien-Regelmenge definiert, die rund 600 Patient:innen identifiziert, aber zu sensitiv (viele False Positives). Baue ein zweistufiges System: (1) Regel-basierter Vorfilter zur Kandidatenmenge, (2) ML-Klassifikator (XGBoost) auf den Vorfilter-Treffern, der die finale Phaenotyp-Wahrscheinlichkeit ausgibt. Bewerte gegen 200 manuell verifizierte Faelle. Liefere Pipeline + 4-seitige Empfehlung an das klinische Forschungsteam.
Das Briefing
Was Du tust und was Du zeigst.
Identifiziere aus einem grossen EHR-Datensatz seltene Phaenotyp-Patient:innen mit hoher Praezision und uebergibst eine produktive Pipeline.
Earning criteria — what you'll demonstrate
- EHR-Daten methodisch sauber aufbereiten (Code-Mapping, Zeitfenster, fehlende Werte)
- Regel-Wissen und ML-Lernen in einer Pipeline kombinieren
- Klassifikatoren auf stark imbalancierte klinische Datensaetze trimmen
- Modell-Outputs in priorisierte Arzt-Review-Listen uebersetzen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenApplied AI Scientist
EHR-basierte Phaenotypisierung fuer klinische Studien ist eine zentrale angewandte KI-Aufgabe in Pharma-Forschungsteams.
Dieses Projekt schärft
- clinical-ml
- phenotyping
- ehr-data
Data Scientist
Regelbasiertes und ML-Wissen in einer Pipeline zu verheiraten ist Senior-Data-Scientist-Disziplin in Pharma- und Versorgungsforschung.
Dieses Projekt schärft
- supervised-learning
- xgboost
- ehr-data
ML Researcher
Klassifikation auf extrem imbalancierten klinischen Datensaetzen methodisch sauber zu loesen ist eine wiederkehrende Forschungsaufgabe in klinischen ML-Laboren.
Dieses Projekt schärft
- clinical-ml
- phenotyping
- supervised-learning
Noch eine Sache