Structured Prediction für die Layoutextraktion in einem Düsseldorfer LegalTech
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst 4.000 annotierte deutsche Vertrags-PDFs mit pro Token gelabelten Klauselgrenzen, Sektionsgrenzen und Klauseltypen (15 Klassen). Trainiere zwei Modelle: (a) BERT-Base-Embeddings mit linearer Klassifikatorschicht, (b) gleiche Embeddings plus CRF-Layer obendrauf, der Hierarchie-Constraints erzwingt (z. B. 'Klauseltyp X kann nur innerhalb von Sektion Y vorkommen'). Bewerte mit Span-F1 pro Klauseltyp, mit besonderem Fokus auf seltene Klausen (< 200 Trainingsbeispiele). Liefere ein Engineering-Memo, das den Mehrwert von Structured Prediction quantifiziert.
Das Briefing
Was Du tust und was Du zeigst.
Quantifiziere, ob ein CRF-Layer auf BERT-Embeddings die Klausel-Extraktion in deutschen Verträgen gegenüber reinem Sequence-Tagging messbar verbessert.
Earning criteria — what you'll demonstrate
- Structured Prediction konzeptionell verstehen (CRF-Forward-Backward, Viterbi-Decodierung)
- Strukturelle Constraints in einen neuronalen Klassifikator integrieren
- Span-basierte Bewertung für hierarchische Annotationen sauber durchführen
- Fehlermodi systematisch nach Klassengröße und Strukturtyp analysieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP Engineer
Structured Prediction auf deutschen Vertragsdaten anzuwenden und Fehlermodi sauber zu analysieren ist exakt die Einstiegsarbeit eines NLP Engineers in LegalTech oder GovTech.
Dieses Projekt schärft
- structured-prediction
- named-entity-recognition
- transformer-architectures
Machine Learning Engineer
Modellvergleich mit reproduzierbaren Splits und klarer Empfehlung ist die ML-Engineer-Disziplin, die produktionsreife Auslieferungen ermöglicht.
Dieses Projekt schärft
- pytorch
- model-evaluation
- transformer-architectures
Applied AI Scientist
Conditional Random Fields auf moderne Transformer-Architekturen zu legen ist eine forschungsnahe Methodenwahl, die angewandte KI-Wissenschaftler regelmäßig treffen.
Dieses Projekt schärft
- conditional-random-fields
- structured-prediction
- model-evaluation
Noch eine Sache