Code
Fine-Tuning eines Sprachmodells für regulatorische Dokumente in der Pharma-Branche
Übersicht
Worum es bei diesem Projekt geht.
Euer Team erhält einen anonymisierten Korpus von 8.000 regulatorischen Dokumenten mit bestehenden Kategorien aus dem Dokumentenmanagementsystem. Eure Aufgabe ist es, ein vortrainiertes deutsch-englisches Sprachmodell (zum Beispiel XLM-RoBERTa oder ein vergleichbares mehrsprachiges Modell) mittels Fine-Tuning auf die spezifische Domäne anzupassen. Dabei müsst ihr ein Verfahren entwickeln, das mit ungleich verteilten Klassen umgehen kann (einige Dokumententypen sind deutlich seltener). Erstellt außerdem ein Konzept, wie das Modell in den bestehenden Arbeitsprozess der Regulatory Affairs Abteilung integriert werden kann, ohne dass Fachjurist:innen die Kontrolle verlieren. Die Abteilungsleitung will wissen: Wie hoch ist die erwartete Zeitersparnis? Welche Fehlerarten macht das Modell? Und wie wird die menschliche Überprüfung sichergestellt?
Das Briefing
Was Du tust und was Du zeigst.
Wie kann ein forschendes Pharmaunternehmen ein angepasstes Sprachmodell entwickeln, das regulatorische Dokumente zuverlässig klassifiziert und gleichzeitig in bestehende, regulierte Arbeitsprozesse integriert wird?
Earning criteria — what you'll demonstrate
- Domänenspezifisches Fine-Tuning mehrsprachiger Transformer-Modelle für hochregulierte Branchen
- Entwicklung von Strategien zum Umgang mit unbalancierten Datensätzen in der Textklassifikation
- Bewertung von Modellunsicherheit und Gestaltung von Human-in-the-Loop-Prozessen
- Übersetzung technischer NLP-Ergebnisse in regulatorisch konforme Arbeitsabläufe
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Machine Learning Engineer
Diese Challenge vermittelt praktische Erfahrung im produktionsreifen Fine-Tuning und der Modelloptimierung — Kernkompetenzen von Machine Learning Engineers, die Modelle von der Experimentierphase in stabile Systeme überführen.
Dieses Projekt schärft
- large-language-models
- fine-tuning
- model-deployment-concepts
Data Ethics Officer
Die Auseinandersetzung mit Fehlerarten in hochregulierten Kontexten und dem menschlichen Überprüfungsprozess bereitet gezielt auf die Verantwortung für ethische und regulatorische Konformität von KI-Systemen vor.
Dieses Projekt schärft
- regulatory-domain-knowledge
- model-deployment-concepts
- natural-language-processing
Regulatory Analyst
Das Verständnis für Möglichkeiten und Grenzen automatisierter Dokumentenklassifikation ist essenziell für Regulatory Analysts, die die Digitalisierung regulatorischer Prozesse gestalten und bewerten müssen.
Dieses Projekt schärft
- regulatory-domain-knowledge
- natural-language-processing
- multilingual-models
Noch eine Sache