Transformer-Fine-Tuning für deutsche Patentanwaltskanzlei
Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten 14.000 deutsche Patentschriften-Abstracts mit Klassen-Labels. Fine-tunen Sie gbert-large (deutsches BERT) auf 80 % der Daten und evaluieren auf 20 %. Baseline: TF-IDF (1-3-Gramme) + Logistic Regression mit ausgewogenen Klassen. Messen Sie Macro-F1, Per-Klasse-F1 und Confusion-Matrix. Führen Sie eine 100-Beispiel-Fehleranalyse mit Aufmerksamkeits-Visualisierung durch: welche Wörter triggert das Modell pro Klasse? Erfolg: gbert schlägt Baseline um mindestens 8 F1-Punkte und Sie können die Modell-Entscheidungen für 10 Stichproben plausibel erklären.
Das Briefing
Was Du tust und was Du zeigst.
Schlägt ein fine-getuntes deutsches BERT-Modell ein gut gemachtes TF-IDF-Baseline auf der Klassifikation deutscher Patentabstracts um klinisch relevante 8 F1-Punkte?
Earning criteria — what you'll demonstrate
- Deutsche Transformer-Modelle praktisch fine-tunen
- Klassische und neuronale Ansätze fair gegenüberstellen
- Aufmerksamkeits-Visualisierung als Erklärbarkeits-Werkzeug nutzen
- Per-Klasse-Performance jenseits von Aggregat-Metriken interpretieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
Deutsches Transformer-Fine-Tuning mit Erklärbarkeit ist ein direkt produktrelevantes Profil in DACH-Legaltech und Compliance-Teams.
Dieses Projekt schärft
- transformer-fine-tuning
- german-bert
- attention-visualization
Machine-Learning-Ingenieur:in
Fine-Tuning + Evaluation + Baseline-Vergleich ist exakt das Engineering-Profil, das MLE-Rollen in NLP-Teams definiert.
Dieses Projekt schärft
- transformer-fine-tuning
- text-classification
- evaluation
Data Scientist:in
Eine Domänen-NLP-Lösung von Datenanalyse bis Empfehlungs-Bericht ist das End-to-End-Profil, das DS-Rollen in Mittelständlern erwarten.
Dieses Projekt schärft
- text-classification
- evaluation
- pytorch
Noch eine Sache