Constitutional-AI-Replikation fuer mittelstaendischen Versicherungs-Chatbot
Übersicht
Worum es bei diesem Projekt geht.
Du entwirfst: (1) eine Constitution mit 8-12 Sicherheits-Prinzipien fuer Versicherungs-Kundenkontakt (Datenschutz, Beratungsabgrenzung, klare Eskalation), (2) eine Critique-and-Revise-Pipeline (Modell schreibt Antwort, Modell kritisiert, Modell schreibt revidierte Antwort), (3) Sammlung von rund 2.000 (Original, Revidiert)-Paaren auf einem Prompt-Set, (4) DPO-Training auf diesen Paaren. Bewerte: Sicherheits-Disziplin auf 60 Test-Prompts, Antwortqualitaet auf 60 normalen Service-Prompts, Vergleich gegen Basis- und gegen SFT-Pipeline. Liefere die Methodik und einen Compliance-Bericht.
Das Briefing
Was Du tust und was Du zeigst.
Repliziere eine vereinfachte Constitutional-AI-Pipeline (Critique-Revise + DPO) auf einem Open-Source-Modell fuer einen Versicherungs-Chatbot.
Earning criteria — what you'll demonstrate
- Constitutional-AI-Idee verstehen und vereinfacht replizieren
- RLHF/DPO-Pipelines aus selbst generierten Praeferenzdaten aufsetzen
- Sicherheit ueber Modellgewichte (statt nur Filter) verankern
- Compliance-Aussagen ueber Sicherheits-Disziplin quantitativ machen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenAI Safety Researcher
Eine Constitutional-AI-Pipeline zu replizieren und gegen Compliance-Aussagen auszuwerten ist die Tag-eins-Arbeit eines AI Safety Researchers in Foundation-Laboren und in Beratungen mit Sicherheits-Mandat.
Dieses Projekt schärft
- constitutional-ai
- alignment-evaluation
- responsible-ai
ML Researcher
RLHF- und DPO-Pipelines aus selbst generierten Praeferenzdaten aufzubauen ist Kerngebiet von ML Researchers in Alignment- und Sprachmodell-Forschungsteams.
Dieses Projekt schärft
- rlhf
- direct-preference-optimization
- constitutional-ai
Applied AI Scientist
Forschungsmethoden in eine regulierte Industrieanwendung mit Compliance-Bericht zu uebersetzen ist Kerngebiet von Applied AI Scientists in Versicherungs- und Finanzhaeusern.
Dieses Projekt schärft
- constitutional-ai
- responsible-ai
- direct-preference-optimization
Noch eine Sache