Vector-Suche für Produkt-Empfehlungen bei einem Hamburger FMCG-Konzern
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst Embeddings für 180.000 Produkte (768-dimensional, aus einem mehrsprachigen Sentence-Transformer), 5.000 Such-Anfragen mit Relevanz-Labels (Klick = relevant, gewertet binär) und Zugang zu einem 4-Kern-VM. Implementiere zwei Such-Backends: (1) selbst betriebener Faiss-HNSW-Index, (2) Managed-SaaS (Pinecone oder Weaviate Cloud). Benchmark beide auf Recall@10, P95-Latenz und Kosten pro Million Anfragen. Liefere die Benchmark-Pipeline, einen 3-seitigen Vergleichs-Memo und eine Build-vs-Buy-Empfehlung.
Das Briefing
Was Du tust und was Du zeigst.
Vergleiche selbst betriebenen HNSW-Index gegen Managed-SaaS auf Latenz, Recall und Kosten und liefere eine Build-vs-Buy-Empfehlung für 180.000 Produkte.
Earning criteria — what you'll demonstrate
- Approximative Nearest-Neighbor-Suche mit Faiss konfigurieren und tunen
- Vector-Search-Performance fair zwischen Backends benchmarken
- Kosten-Modelle für Managed-Services in eine Empfehlung einarbeiten
- Eine Build-vs-Buy-Entscheidung mit Daten verteidigen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenMaschinelles-Lernen-Ingenieur:in
Vector-Search-Backends gegeneinander zu benchmarken und eine Build-vs-Buy-Empfehlung zu liefern, ist eine häufige Tagesaufgabe für MLE in Enterprise-Stacks.
Dieses Projekt schärft
- vector-search
- benchmarking
- embeddings
KI-Architekt:in
Build-vs-Buy mit Daten zu verteidigen und Vendor-Lock-in mitzudenken ist die Brückenarbeit zwischen Engineering und Plattform-Strategie, die KI-Architekt:innen leisten.
Dieses Projekt schärft
- cost-analysis
- vector-search
- evaluation
Data Engineer
Index-Konfiguration und Latenz-Profiling sind Data-Engineering-Kernkompetenzen für jede semantische Such-Plattform.
Dieses Projekt schärft
- python
- benchmarking
- vector-search
Noch eine Sache