Multilinguale Wissens-Suche für ein DACH-FMCG-Unternehmen
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst 6.000 Dokumente (etwa 60 % DE, 25 % EN, 15 % PL) und 150 Benchmark-Anfragen (50 pro Sprache) mit Goldstandard-Treffern. Baue eine Pipeline mit (1) sprachneutraler Embedding-Suche mit einem mehrsprachigen Modell; (2) Sprach-Identifikation pro Anfrage und Dokument; (3) Snippet-Übersetzung in die Anfragesprache (DeepL- oder NLLB-Modell). Evaluiere Cross-Lingual-nDCG@10 und Latenz. Liefere Code, Demo, Evaluation und ein Empfehlungs-Memo (3 Seiten).
Das Briefing
Was Du tust und was Du zeigst.
Wie gut beantwortet eine multilinguale Suche Anfragen in einer Sprache mit Treffern aus den beiden anderen Sprachen, ohne Übersetzungsqualität zu opfern?
Earning criteria — what you'll demonstrate
- Mehrsprachige Embeddings effektiv für Cross-Lingual Retrieval einsetzen
- Sprach-Identifikation als Pipeline-Schritt korrekt platzieren
- Übersetzung als optionalen Output-Schritt sauber von Retrieval trennen
- Multilinguale Evaluation methodisch durchführen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
Cross-Lingual-Retrieval mit Sprach-Identifikation und Übersetzung ist eine direkte Aufgabe von NLP-Ingenieur:innen in international aufgestellten Konzernen.
Dieses Projekt schärft
- cross-lingual-retrieval
- machine-translation
- language-identification
Machine-Learning-Ingenieur:in
Pipeline-Bau mit klaren Latenz-Budgets und Per-Sprache-Evaluation gehört zur Standardarbeit von ML-Ingenieur:innen in Suche und Wissens-Management.
Dieses Projekt schärft
- dense-retrieval
- evaluation
- elasticsearch
KI-Engineer
Mehrere Modellbausteine (Embeddings, Sprach-ID, Übersetzung) als ein robuster Endpoint zu verschalten, ist Kernarbeit von KI-Engineers in Enterprise-Teams.
Dieses Projekt schärft
- machine-translation
- dense-retrieval
- language-identification
Noch eine Sache