Frequent-Pattern-Mining auf Clickstream-Daten eines AdTech-Anbieters
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst Bid-Logs (anonymisiert, ohne PII — personenbezogene Daten) als Parquet-Dateien (rund 600 GB) und einen Conversion-Join-Datensatz. Definiere Items sinnvoll (Domain-Hash, 6 Tageszeit-Buckets, 3 Geräteklassen, 2 Browserklassen). Implementiere FP-Growth (PySpark mlib oder mlxtend bei Sampling). Wähle Schwellen für Support, Konfidenz und Lift datengetrieben. Filtere Muster, die trivial sind (z. B. 'mobile + Android' ist redundant). Liefere Top-200 Muster, eine JSON-Ausspielform für das Bidding-System und ein Notebook mit reproduzierbarer Pipeline.
Das Briefing
Was Du tust und was Du zeigst.
Wie generiert man aus 4 Wochen Bid-Logs die Top-200 produktiv nutzbaren Itemsets, die das Bidding-System mit echten Geschäftsmustern statt Heuristiken bestückt?
Earning criteria — what you'll demonstrate
- FP-Growth auf realen, großen Clickstream-Daten anwenden
- Items sinnvoll definieren — die Halbe-Miete-Entscheidung im Pattern Mining
- Triviale Muster algorithmisch ausfiltern (Closed/Maximal Itemsets)
- Muster in maschinenlesbare Ausspielform übersetzen, nicht nur in Tabellen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenData Scientist
Frequent-Pattern-Mining auf Skalen-Daten mit klarer Geschäftsausspielung ist eine Kern-Fähigkeit für Data Scientists in AdTech, E-Commerce und MarTech — die Challenge zeigt End-to-End-Denken.
Dieses Projekt schärft
- frequent-pattern-mining
- data-mining
- pattern-evaluation
Data-Analyst:in
Data Analysts, die FP-Growth und Lift-Konzepte beherrschen, können Marketing-Hypothesen weit über Cohort-Analysen hinaus belegen.
Dieses Projekt schärft
- pattern-evaluation
- feature-engineering
- data-mining
AI Engineer
AI Engineers übernehmen genau solche Pipelines in die Produktion — Erfahrung mit PySpark-FP-Growth ist ein direktes Skill-Match für Recommendation-System-Stellen.
Dieses Projekt schärft
- pyspark
- fp-growth
- data-mining
Noch eine Sache