Embedding-Modell für deutsche Produktdaten feinjustieren
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst 80.000 Produkt-Datensätze (Titel, Beschreibung, Kategorien) plus 1.200 historische Klick-Logs ('Anfrage X -> geklicktes Produkt Y') und 100 manuell gelabelte Test-Anfragen. Trainiere drei Modell-Varianten: (1) generisches deutsches Sentence-Transformer-Modell ohne Anpassung, (2) feinjustierte Variante auf Klick-Logs, (3) feinjustierte Variante mit hard-negative-Sampling aus derselben Kategorie. Speichere alle drei in einer ChromaDB-Instanz und benchmarke MRR (mittlerer reziproker Rang), NDCG@10 und Precision@5 auf den 100 Test-Anfragen. Liefere die Gewinnvariante plus Memo mit Kostenrechnung Training + Inferenz pro Monat.
Das Briefing
Was Du tust und was Du zeigst.
Feinjustiere ein Embedding-Modell auf deutsche Industrieprodukt-Daten und entscheide datenbasiert, ob das Training den Mehrwert gegenüber dem generischen Modell rechtfertigt.
Earning criteria — what you'll demonstrate
- Sentence-Transformer-Modelle mit Contrastive Learning feinjustieren
- Hard-Negative-Sampling-Strategien für Retrieval-Modelle anwenden
- Klick-Logs als implizite Labels für Ranking-Training nutzbar machen
- Trade-off zwischen Modellkosten und Retrieval-Qualität quantifizieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenAngewandte:r KI-Wissenschaftler:in
Ein Embedding-Modell auf Produktionsdaten feinzujustieren, ehrlich zu evaluieren und in eine Empfehlung zu übersetzen, ist exakt der Kern angewandter KI-Arbeit in Produkt- und Marktplatz-Teams.
Dieses Projekt schärft
- embedding-fine-tuning
- contrastive-learning
- evaluation
Maschinelles-Lernen-Ingenieur:in
Training, Versionierung und Eval-Disziplin für Embedding-Modelle gehören zum Kerngeschäft eines:r MLE in Such- und Empfehlungssystemen.
Dieses Projekt schärft
- embedding-fine-tuning
- sentence-transformers
- pytorch
ML-Forscher:in
Hard-Negative-Sampling-Strategien zu vergleichen und sauber zu vermessen, spiegelt die Methodendisziplin, die ML-Forschende in angewandten Retrieval-Projekten bringen müssen.
Dieses Projekt schärft
- contrastive-learning
- embedding-fine-tuning
- vector-search
Noch eine Sache