Dataset-Kuratierung und Eval-Harness für ein medizinisches Fachmodell
Übersicht
Worum es bei diesem Projekt geht.
Du bekommst 12.000 anonymisierte Radiologie-Berichte (rohe Exports), Klinik-Style-Guide und eine Liste typischer Failure-Modes (Halluzinationen, falsche Befund-Vereinfachungen). Baue: (1) eine Datenpipeline mit Deduplizierung, Filterregeln und Qualitäts-Scoring, (2) einen Eval-Harness mit automatischen Metriken (BLEU, ROUGE, fachspezifische Regeln) plus einem Schema für menschliche Bewertung, (3) eine Doku, die spätere Fine-Tuning-Experimente vergleichbar macht. Liefere Code, kuratiertes Datenset (Statistiken) und einen 4-seitigen Bericht.
Das Briefing
Was Du tust und was Du zeigst.
Liefere eine kuratierte Trainingsdaten-Pipeline und einen reproduzierbaren Eval-Harness für radiologische Befundgenerierung, der spätere Fine-Tuning-Vergleiche valide macht.
Earning criteria — what you'll demonstrate
- Trainingsdaten-Pipelines für LLMs systematisch aufbauen (Dedup, Filter, Qualität)
- Automatische und menschliche Eval kombinieren, ohne dass eine die andere überdeckt
- Annotations-Protokolle entwerfen und Reliability messen
- Eine Eval-Methodik so dokumentieren, dass spätere Experimente vergleichbar bleiben
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenData Engineer
Eine produktive Trainingsdaten-Pipeline für ein sensibles Korpus aufzubauen ist eines der konkretesten Erstprojekte für Data Engineers in Klinik-Forschungs-Teams.
Dieses Projekt schärft
- data-pipelines
- deduplication
- dataset-curation
ML-Ingenieur:in
Reproduzierbare Eval-Harnesses sind das Rückgrat seriöser LLM-Arbeit; das Projekt vermittelt die Praxis hands-on.
Dieses Projekt schärft
- llm-evaluation
- python
- dataset-curation
ML-Forscher:in
Saubere Annotations-Protokolle und Reliability-Messung sind methodische Pflichtkompetenz für ML-Forschende, die mit menschlichen Bewertungen arbeiten.
Dieses Projekt schärft
- annotation-protocols
- llm-evaluation
- dataset-curation
Noch eine Sache