Named-Entity-Recognition für Schweizer Rechtsanwaltskanzlei
Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten 1.200 annotierte Vertragsabschnitte (je 400 pro Sprache) mit 8 Entity-Typen. Fine-tunen Sie ein multilinguales XLM-RoBERTa-Modell auf 80 % der Daten und evaluieren Sie auf 20 %. Implementieren Sie ein regelbasiertes Baseline mit spaCy-Patterns + Regex für Geldbeträge/Daten. Vergleichen Sie: Per-Entity-F1, Cross-Lingual-Transfer (trainieren auf DE+EN, evaluieren auf FR), Fehlertypen. Erfolgskriterium: XLM-RoBERTa schlägt das Baseline um mindestens 12 F1-Punkte im Durchschnitt, und Cross-Lingual-Transfer auf FR erreicht mindestens 75 % der monolingualen FR-Performance.
Das Briefing
Was Du tust und was Du zeigst.
Liefert ein fine-getuntes multilinguales NER-Modell substantiell bessere Vertragsdaten-Extraktion als ein gut gemachtes regelbasiertes System — auch im Cross-Lingual-Transfer?
Earning criteria — what you'll demonstrate
- Multilinguales NER mit Transformer-Modellen praktisch umsetzen
- Cross-Lingual-Transfer als eigenes Evaluations-Setting verstehen
- Neuronales Modell ehrlich gegen ein regelbasiertes Baseline vergleichen
- Domänenspezifische Fehlertypen kategorisieren und ableiten, wo neuronal vs. regelbasiert besser passt
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
Multilinguales NER mit Cross-Lingual-Transfer ist ein praxisrelevantes Spezialprofil, das in europäischen Legaltech-, Finanz- und Compliance-Teams direkt gefragt ist.
Dieses Projekt schärft
- named-entity-recognition
- multilingual-nlp
- xlm-roberta
Machine-Learning-Ingenieur:in
Fine-Tuning + Eval + Vergleich gegen Baseline ist exakt das Engineering-Profil, das MLE-Rollen in produktiven NLP-Teams definiert.
Dieses Projekt schärft
- fine-tuning
- evaluation
- named-entity-recognition
KI-Ingenieur:in
Wer mehrsprachige NLP-Modelle in produktnahen Domänen (Verträge) zum Laufen bringt, qualifiziert sich für AI-Engineer-Rollen in jedem europäischen B2B-SaaS mit Document-AI-Komponente.
Dieses Projekt schärft
- multilingual-nlp
- spacy
- evaluation
Noch eine Sache