Word-Embedding-Vergleich für Stuttgarter Automotive-NLP-Team
Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten 280.000 deutsche Werkstatt-Reports. Trainieren Sie zwei Embedding-Varianten von Grund auf auf der Domäne: (1) Word2Vec mit Skip-Gram, (2) FastText (handhabt OOV-Wörter über Sub-Word). Vergleichen Sie mit (3) deutschem fastText-Wikipedia-Modell, (4) gbert-large Sentence-Embedding via mean-pooling. Bauen Sie ein Eval-Set mit 200 vom Fach-Team validierten Wort-Paaren (synonym/verwandt/unverwandt). Messen Sie Spearman-Korrelation zwischen Embedding-Cosinus und Fach-Team-Score. Liefern Sie eine Empfehlungs-Tabelle plus 4-seitigen Bericht.
Das Briefing
Was Du tust und was Du zeigst.
Welcher Embedding-Ansatz liefert auf Werkstatt-Fehler-Reports mit hohem Fach-Jargon-Anteil die beste semantische Ähnlichkeit?
Earning criteria — what you'll demonstrate
- Word- und Sentence-Embeddings als verschiedene Repräsentations-Ansätze verstehen
- Domain-Adaptation von Embeddings praktisch durchführen
- Embedding-Qualität mit standardisierter Spearman-Korrelation messen
- Trade-offs zwischen Off-the-shelf und Custom-Embeddings begründen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
Embedding-Vergleichsstudien mit Domain-Adaptation sind ein direktes NLP-Engineering-Profil für DACH-Industrieunternehmen mit hohem Fach-Jargon-Anteil.
Dieses Projekt schärft
- word-embeddings
- domain-adaptation
- evaluation
Data Scientist:in
Statistische Eval mit Spearman-Bootstrap und Fach-Team-Validierung ist Brot-und-Butter-DS-Arbeit, die für Junior-DS-Rollen direkt qualifiziert.
Dieses Projekt schärft
- evaluation
- word-embeddings
- sentence-embeddings
Machine-Learning-Ingenieur:in
Wer Embedding-Pipelines mit ehrlichem Vergleich zwischen Off-the-shelf und Custom-Modellen baut, übt die Build-vs-Buy-Disziplin, die MLE-Senior-Pfade fordern.
Dieses Projekt schärft
- word2vec
- fasttext
- domain-adaptation
Noch eine Sache