Datenpipeline für Wiener Kulturbetrieb-Analytics aufsetzen
Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten Beispielexporte aus drei Ticketsystemen (CSV, JSON, eine PostgreSQL-Tabelle), ein Logo-Style-Guide und die Liste der gewünschten ersten Reports (Besucher pro Haus pro Woche, Wiederkehrerrate, Kanalattribution). Bauen Sie eine Pipeline mit dbt (auf DuckDB lokal — kein Cloud-Setup nötig), die die drei Quellen in ein sauberes Star-Schema überführt, und die drei Reports als reproduzierbare Notebooks. Schreiben Sie eine zweiseitige Schulungsanleitung für die zwei Teammitglieder, damit sie die Pipeline selbst weiterentwickeln können. Erfolg ist eine Pipeline, die wöchentlich mit einem Befehl durchläuft.
Das Briefing
Was Du tust und was Du zeigst.
Wie lässt sich aus drei unterschiedlichen Ticketsystemen eine wöchentlich aktualisierbare, reproduzierbare Analytics-Basis schaffen, die ein zweiköpfiges Team eigenständig betreibt?
Earning criteria — what you'll demonstrate
- Heterogene Datenquellen in ein konsistentes Datenmodell überführen
- dbt als Werkzeug für reproduzierbare Transformationen einsetzen
- Pipeline-Dokumentation so schreiben, dass eine andere Person sie übernehmen kann
- Standard-Reports gegen ein klares Datenmodell aufsetzen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenData Engineer
Eine reproduzierbare Pipeline aus drei Quellsystemen in ein sauberes Datenmodell zu überführen und übergabefähig zu dokumentieren ist die Kerntätigkeit einer Junior-Data-Engineerin.
Dieses Projekt schärft
- data-modeling
- sql
- reproducibility
Data Scientist
Auf einem sauberen Star-Schema aufzusetzen statt auf rohen Exporten ist die Grundlage seriöser Analytics — und eine Erfahrung, die Data Scientists früh machen sollten.
Dieses Projekt schärft
- data-wrangling
- sql
- documentation
MLOps Engineer
Idempotente Pipelines mit Tests und klarer Versionsverwaltung sind das Fundament, auf dem MLOps-Engineers später ML-Pipelines aufbauen.
Dieses Projekt schärft
- reproducibility
- python
- data-modeling
Noch eine Sache