Dependency-Parsing-Studie für Lexikografie-Verlag in Mannheim
Übersicht
Worum es bei diesem Projekt geht.
Sie evaluieren drei Parser auf dem deutschen UD-GSD-Testset (Universal Dependencies German): (1) Stanza, (2) spaCy de_core_news_lg, (3) Trankit. Messen Sie LAS (Labeled Attachment Score) und UAS (Unlabeled Attachment Score), Geschwindigkeit (Token/Sekunde), Speicher-Footprint. Werten Sie zusätzlich auf einem 5.000-Satz-Verlagseigenen Domain-Sample aus (Romantexte mit komplexerer Syntax). Liefern Sie eine Vergleichstabelle, eine Fehleranalyse mit 30 Worst-Case-Sätzen und einen 5-seitigen Empfehlungs-Bericht im Konferenz-Stil.
Das Briefing
Was Du tust und was Du zeigst.
Welcher moderne Dependency-Parser liefert auf deutschem Verlagstext die beste Kombination aus Genauigkeit, Geschwindigkeit und Domain-Robustheit?
Earning criteria — what you'll demonstrate
- Dependency-Parsing-Konzepte und Metriken (LAS, UAS) praktisch anwenden
- Drei Parser-Familien unter identischen Bedingungen vergleichen
- Domänen-Robustheit als eigenes Eval-Setting verstehen
- Eine technische Empfehlung für eine 3-Jahres-Investitionsentscheidung begründen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
Klassisches NLP-Engineering (Parsing, UD-Standard) ist ein wertvolles Profil neben dem Hype um Sprachmodelle — gerade Verlage und Compliance-Tools brauchen es zuverlässig.
Dieses Projekt schärft
- dependency-parsing
- universal-dependencies
- spacy
Data Engineer:in
Wer Parser auf 800 Mio. Token planbar laufen lassen will, übt Throughput-Engineering, das in jedem Daten-Pipeline-Team relevant ist.
Dieses Projekt schärft
- benchmarking
- spacy
- stanza
Forschungswissenschaftler:in
Eine saubere Parser-Vergleichsstudie mit Konferenz-Style-Bericht ist ein direktes Format für die ACL/EMNLP-Workshop-Welt.
Dieses Projekt schärft
- dependency-parsing
- evaluation
- benchmarking
Noch eine Sache