Off-Policy-Evaluation fuer Recommender-Wechsel bei Stuttgarter Streamingdienst
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst 4 Wochen anonymisierter Empfehlungs-Logs der alten Policy (Aktion = empfohlener Track, Reward = abgespielt > 30 Sekunden, plus die loggende Policy-Wahrscheinlichkeit pro Aktion). Implementiere: (1) Inverse Propensity Scoring (IPS), (2) Self-normalized IPS, (3) Direct Method mit einem Reward-Modell, (4) Doubly Robust. Trainiere eine Kandidaten-Policy (Logistic Regression oder Neural Net) auf den Logs. Vergleiche die 4 OPE-Schaetzer in Bias, Varianz und einem A/B-Validierungs-Mini-Test mit 1 Prozent Traffic. Liefere Methoden-Empfehlung an das Recommender-Team.
Das Briefing
Was Du tust und was Du zeigst.
Vergleiche Off-Policy-Evaluation-Schaetzer auf realen Recommender-Logs und empfehle ein Verfahren fuer Pre-Launch-Bewertung neuer Policies.
Earning criteria — what you'll demonstrate
- Off-Policy-Evaluation als Bruecke zwischen Offline-Lernen und produktivem Einsatz verstehen
- Importance Sampling und Doubly-Robust-Schaetzer korrekt implementieren
- OPE-Schaetzer in Bias und Varianz quantitativ vergleichen
- Recommender-Wechsel-Risiko vor einem Voll-Rollout messbar reduzieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenData Scientist
Off-Policy-Evaluation auf produktiven Recommender-Logs sauber durchzufuehren ist eine seltene und sehr nachgefragte Faehigkeit fuer Data Scientists in Streaming-, E-Commerce- und Ad-Tech-Firmen.
Dieses Projekt schärft
- off-policy-evaluation
- importance-sampling
- contextual-bandits
Applied AI Scientist
OPE als verantwortliche Pre-Launch-Methode zu argumentieren und Bias-Varianz-Trade-offs auszuweisen ist Kerngebiet von Applied AI Scientists in Recommender-Teams.
Dieses Projekt schärft
- off-policy-evaluation
- doubly-robust
- model-evaluation
Machine Learning Engineer
OPE produktionsreif zu paketieren und in einer CI-Pipeline fuer neue Policy-Versionen einzubetten ist eine starke ML-Engineer-Aufgabe in Recommender-Plattformen.
Dieses Projekt schärft
- contextual-bandits
- model-evaluation
- python
Noch eine Sache