Anonymisierung eines Versicherungs-Schadensdaten-Releases
Übersicht
Worum es bei diesem Projekt geht.
Klassifiziere die Felder im Schadensfall-Datensatz nach direkten Identifiern, Quasi-Identifiern und sensiblen Attributen. Implementiere Anonymisierungs-Techniken mit ARX oder einer Python-Bibliothek wie pycanon: Generalisierung von Postleitzahlen, Suppression seltener Werte, Mikroaggregation von Schadenshoehe. Erreiche k-Anonymity (k>=5), l-Diversity fuer sensible Attribute und t-Closeness fuer Schadenshoehen-Verteilung. Fuehre einen Re-Identifikations-Risiko-Score (Prosecutor- und Journalist-Modell) durch. Liefere ein Anonymisierungs-Memo, den anonymisierten Datensatz (Sample), Risiko-Analyse-Bericht und eine Compliance-Empfehlung zur Freigabe.
Das Briefing
Was Du tust und was Du zeigst.
Welche Kombination aus k-Anonymity, l-Diversity und t-Closeness reduziert das Re-Identifikations-Risiko unter eine Compliance-akzeptable Schwelle, ohne den Datensatz fuer externe Forschung unbrauchbar zu machen?
Earning criteria — what you'll demonstrate
- Quasi-Identifier in echten Datensaetzen identifizieren und kategorisieren
- k-Anonymity-, l-Diversity- und t-Closeness-Bedingungen praktisch umsetzen
- Re-Identifikations-Risiken quantitativ ueber etablierte Modelle berechnen
- Trade-off zwischen Nuetzlichkeit und Privacy fuer Compliance-Stakeholder dokumentieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Data Engineer
Data-Engineer-Rollen in Versicherungen und Banken erwarten Anonymisierungs-Erfahrung als Compliance-Skill — die hier geuebte k/l/t-Methodik ist direkt im DACH-Markt nachgefragt.
Dieses Projekt schärft
- data-anonymization
- k-anonymity
- data-modeling
Data Scientist
Data-Scientist-Rollen in regulierten Branchen muessen Daten-Releases verteidigen koennen — die hier produzierte Risiko-Argumentation ist genau die Sprache, in der Compliance-Reviews stattfinden.
Dieses Projekt schärft
- data-anonymization
- risk-analysis
- python-programming
Backend Engineer
Backend-Engineer-Rollen, die Anonymisierungs-Pipelines produktiv betreiben, brauchen das Verstaendnis aus dieser Challenge, um Implementierungs-Faehigkeit von Marketing-Buzzwords zu trennen.
Dieses Projekt schärft
- data-anonymization
- k-anonymity
- data-modeling
Noch eine Sache