Skip to contentSkip to content
Verifizierte Zertifikate. On-Chain. Für immer.Mehr erfahren
Cover image for Dataset-Kuratierung und Eval-Harness für ein medizinisches Fachmodell
Code

Dataset-Kuratierung und Eval-Harness für ein medizinisches Fachmodell

FreeVerified credential3 WochenAdvanced

Übersicht

Worum es bei diesem Projekt geht.

Du bekommst 12.000 anonymisierte Radiologie-Berichte (rohe Exports), Klinik-Style-Guide und eine Liste typischer Failure-Modes (Halluzinationen, falsche Befund-Vereinfachungen). Baue: (1) eine Datenpipeline mit Deduplizierung, Filterregeln und Qualitäts-Scoring, (2) einen Eval-Harness mit automatischen Metriken (BLEU, ROUGE, fachspezifische Regeln) plus einem Schema für menschliche Bewertung, (3) eine Doku, die spätere Fine-Tuning-Experimente vergleichbar macht. Liefere Code, kuratiertes Datenset (Statistiken) und einen 4-seitigen Bericht.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

Das Briefing

Was Du tust und was Du zeigst.

Liefere eine kuratierte Trainingsdaten-Pipeline und einen reproduzierbaren Eval-Harness für radiologische Befundgenerierung, der spätere Fine-Tuning-Vergleiche valide macht.

Earning criteria — what you'll demonstrate

  • Trainingsdaten-Pipelines für LLMs systematisch aufbauen (Dedup, Filter, Qualität)
  • Automatische und menschliche Eval kombinieren, ohne dass eine die andere überdeckt
  • Annotations-Protokolle entwerfen und Reliability messen
  • Eine Eval-Methodik so dokumentieren, dass spätere Experimente vergleichbar bleiben

Studienpassung

Wo dies in Dein Studium passt.

Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.

Fähigkeiten

Fähigkeiten, die Du unter Beweis stellst.

Jede taucht auf Deinem verifizierten Zertifikat auf.

Karrieren

Berufe, auf die dies Dich vorbereitet.

Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.

Karrierewege, die das aufbaut

Kanonische Rollen

Data Engineer

Eine produktive Trainingsdaten-Pipeline für ein sensibles Korpus aufzubauen ist eines der konkretesten Erstprojekte für Data Engineers in Klinik-Forschungs-Teams.

Dieses Projekt schärft

  • data-pipelines
  • deduplication
  • dataset-curation

ML-Ingenieur:in

Reproduzierbare Eval-Harnesses sind das Rückgrat seriöser LLM-Arbeit; das Projekt vermittelt die Praxis hands-on.

Dieses Projekt schärft

  • llm-evaluation
  • python
  • dataset-curation

ML-Forscher:in

Saubere Annotations-Protokolle und Reliability-Messung sind methodische Pflichtkompetenz für ML-Forschende, die mit menschlichen Bewertungen arbeiten.

Dieses Projekt schärft

  • annotation-protocols
  • llm-evaluation
  • dataset-curation

Noch eine Sache

Du kannst ein Zertifikat bis Freitag in Deinem Lebenslauf haben.