Instruction-Tuning-Dataset fuer Domaenen-Spezialisierung im Pharma-Bereich
Übersicht
Worum es bei diesem Projekt geht.
Du designst: (1) Dataset-Spezifikation mit 8 Aufgabentypen (Frage-Antwort, Zusammenfassung, Strukturierung, Risiko-Kommentierung etc.), (2) Annotations-Guidelines mit klaren Beispielen und Verweigerungs-Regeln, (3) Pilot-Annotation von 500 Beispielen (du oder gemeinsam mit einer Chemiefachkraft), (4) SFT-Training mit LoRA, (5) Eval auf 100 Holdout-Prompts mit Domaenenexpertin-Bewertung. Berichte Trade-offs: domaenenspezifische Verbesserung vs. erhaltene Sicherheits-Disziplin (z. B. ueber das Helpful-Honest-Harmless-Framework).
Das Briefing
Was Du tust und was Du zeigst.
Designe und pilotiere ein Instruction-Tuning-Dataset fuer pharma-chemische Aufgaben und bewerte den Trade-off zwischen Domaenen-Gewinn und Sicherheits-Erosion.
Earning criteria — what you'll demonstrate
- Dataset-Design als zentrale Variable in Instruction-Tuning verstehen
- Annotations-Guidelines so verfassen, dass Inter-Annotator-Agreement hoch bleibt
- Domaenen-Gewinn und Sicherheits-Erosion getrennt messen
- Alignment-Tax als ehrlich kommunizierbares Konzept etablieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenML Researcher
Instruction-Tuning-Dataset-Design mit ehrlicher Alignment-Tax-Bewertung ist Kerngebiet von ML Researchers in domaenenspezifischen Foundation-Modell-Teams.
Dieses Projekt schärft
- instruction-tuning
- dataset-design
- domain-specialization
AI Safety Researcher
Alignment-Tax messbar zu machen ist eine seltene und gefragte Faehigkeit fuer AI Safety Researchers in Industrie und Foundation-Laboren.
Dieses Projekt schärft
- alignment-evaluation
- supervised-finetuning
- instruction-tuning
Applied AI Scientist
Domaenen-Spezialisierung mit Sicherheits-Disziplin auszuliefern und der IT-Leitung verstaendlich zu argumentieren ist die Tag-eins-Arbeit eines Applied AI Scientists in regulierten Branchen.
Dieses Projekt schärft
- lora
- domain-specialization
- alignment-evaluation
Noch eine Sache