Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten den Produktkatalog (12.000 Produkte mit Bildern + deutschen Produkttexten) und ein Eval-Set von 200 Nutzer-Anfragen (Foto → erwartete Top-Produkte). Berechnen Sie CLIP-Embeddings für alle Produktbilder und speichern Sie sie in Qdrant. Implementieren Sie zwei Retrieval-Varianten: (1) Bild-zu-Bild (CLIP-Image-Embedding der Query gegen Produktbilder), (2) Bild-zu-Text (CLIP-Image-Embedding gegen vektorisierte Produkttexte). Vergleichen Sie mit einer textbasierten BM25-Baseline. Messen Sie Recall@5 und Mean Reciprocal Rank. Erfolg: Bild-zu-Bild schlägt BM25 um mindestens 25 % Recall@5.
Das Briefing
Was Du tust und was Du zeigst.
Wie viel besser performt CLIP-basierte Visual-Search gegenüber textbasierter Suche für die Möbel-Stil-Anfragen eines E-Commerce-Katalogs?
Earning criteria — what you'll demonstrate
- CLIP als praktisches Tool für multimodalen Retrieval einsetzen
- Eine Vector-DB für reale Katalog-Größen aufsetzen
- Retrieval-Metriken (Recall@k, MRR) korrekt berechnen und interpretieren
- Worst-Case-Anfragen als Quelle für nächste Iterationen nutzen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenMachine-Learning-Ingenieur:in
Multimodale Retrieval-Systeme sind 2026 ein Standard-Use-Case in jedem E-Commerce; CLIP + Vector-DB-Erfahrung mit echter Eval qualifiziert direkt für Junior-MLE-Rollen in Search-Teams.
Dieses Projekt schärft
- multimodal-embeddings
- clip
- vector-databases
Computer-Vision-Ingenieur:in
Visual-Search ist eine produktnahe CV-Anwendung; die Erfahrung mit CLIP-Embeddings und Retrieval-Metriken bildet exakt das Profil, das CV-Teams in Consumer-Companies suchen.
Dieses Projekt schärft
- clip
- visual-search
- retrieval-evaluation
KI-Ingenieur:in
Ein lauffähiger Retrieval-Service mit Streamlit-Demo, Eval und Bericht ist exakt das End-to-End-Profil, das AI-Engineer-Rollen in Produkt-Teams definiert.
Dieses Projekt schärft
- multimodal-embeddings
- vector-databases
- python
Noch eine Sache