VAE für synthetische Tabellen-Daten in einem Versicherungs-Forschungslabor
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst einen anonymisierten Schadendatensatz (100.000 Zeilen, 24 Spalten — kategorisch und numerisch gemischt). Implementiere einen Tabellen-VAE (z. B. CTGAN-Architektur oder TVAE), generiere 100.000 synthetische Zeilen und bewerte (a) Statistische Treue (marginale Verteilungen, Korrelationen, Modell-Utility auf einem Holdout-Aktuariats-Modell) und (b) Privacy (Membership-Inference-Test, Distance-to-Closest-Record). Liefere eine 4-seitige Privacy-Utility-Analyse und eine Empfehlung, ob die synthetischen Daten für externe Forschungs-Kooperationen freigegeben werden können.
Das Briefing
Was Du tust und was Du zeigst.
Wie generiert man synthetische Tabellen-Daten, die statistisch nützlich UND datenschutz-konform sind, und wie belegt man beides nachvollziehbar?
Earning criteria — what you'll demonstrate
- VAE-Architekturen für Tabellen-Daten verstehen und implementieren
- Statistische Treue mehrdimensional bewerten (marginale, Korrelations-, Modell-Utility)
- Privacy-Metriken (Membership-Inference, DCR) sauber durchführen
- Privacy-Utility-Trade-off in einer aufsichtsfähigen Form artikulieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenML Researcher
Synthetische Daten + Privacy-Forschung sind ein wachsendes Feld in regulierten Branchen; die Challenge produziert genau das Profil, das Versicherungs- und Pharma-Forschungslabore einstellen.
Dieses Projekt schärft
- variational-autoencoders
- synthetic-data-generation
- differential-privacy
AI Safety Researcher
Membership-Inference und Privacy-Utility-Trade-off sind Kerndisziplinen der AI-Safety-Forschung — die Challenge übt sie unter realistischen Bedingungen.
Dieses Projekt schärft
- differential-privacy
- synthetic-data-generation
- evaluation
Research Scientist
Eine aufsichtsfähige Privacy-Analyse zu schreiben — inklusive Shadow-Classifier-Methode — entspricht der Rigorosität, die wissenschaftliche Rollen in Konzern-Forschungslaboren verlangen.
Dieses Projekt schärft
- variational-autoencoders
- evaluation
- tabular-modeling
Noch eine Sache