Empfehlungssystem für ein Berliner Musik-Streaming-Startup
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst einen anonymisierten Listen-Datensatz von rund 600.000 Nutzer:innen und 90.000 Tracks (rund 35 Millionen Listen-Events der letzten 12 Wochen). Implementiere (1) eine Popularitäts-Baseline, (2) eine Matrix-Faktorisierung (ALS oder BPR), (3) eine Diversitäts-Re-Ranking-Schicht (z. B. Maximal Marginal Relevance). Reportiere Recall@20, NDCG@20 und einen Diversitäts-Score (z. B. Intra-List-Diversity über Track-Embeddings) auf einem chronologischen Holdout-Set. Liefere die Pipeline, eine Auswertungstabelle und ein 3-seitiges Memo für das Produkt-Team mit einer Roll-out-Empfehlung.
Das Briefing
Was Du tust und was Du zeigst.
Baue ein Empfehlungssystem, das Recall und NDCG der Baseline schlägt und gleichzeitig die Diversität der Empfehlungen messbar erhöht.
Earning criteria — what you'll demonstrate
- Matrix-Faktorisierungs-Methoden auf großen impliziten Feedback-Datensätzen anwenden
- Diversität als zweite Achse neben Genauigkeit operationalisieren
- Chronologische Holdout-Splits sauber aufsetzen
- Eine Roll-out-Empfehlung mit messbaren Trade-offs verteidigen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenMaschinelles-Lernen-Ingenieur:in
Recommender-Systeme mit klarem Holdout-Setup und produkt-relevanten Trade-offs zu bauen ist die typische MLE-Arbeit in Streaming- und Marketplace-Plattformen.
Dieses Projekt schärft
- recommender-systems
- collaborative-filtering
- evaluation
Angewandte:r KI-Wissenschaftler:in
Diversität als zweite Achse zu operationalisieren und mit Produkt-Strategie zu verbinden ist Brückenarbeit, die angewandte KI-Wissenschaftler:innen in Medien-Produkten leisten.
Dieses Projekt schärft
- ranking
- embeddings
- evaluation
Data Scientist
Chronologische Splits und ehrliche Konfidenz-Reports sind Data-Science-Disziplin, die in jedem produkt-relevanten Empfehlungs-Setup gebraucht wird.
Dieses Projekt schärft
- evaluation
- python
- collaborative-filtering
Noch eine Sache