Open-Domain-QA-System fuer juristische Datenbank eines Frankfurter Verlags
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst einen Auszug von rund 50.000 Entscheidungen plus 300 manuell annotierte Frage-Antwort-Paare mit Quellenangabe. Implementiere: (1) BM25-Index ueber Pyserini oder Whoosh, (2) Top-20-Retrieval pro Frage, (3) ein extraktives Reader-Modell (z. B. ein gefintunter Multilingual-Encoder), das pro Passage einen Span-Score liefert, (4) eine finale Reranking-Logik. Bewerte: Exact-Match (EM) und F1 auf der Antwortspanne plus Recall der Quellen-Entscheidung. Liefere eine FastAPI-Schnittstelle und eine Eval-Suite, die alle Metriken reproduzierbar erzeugt.
Das Briefing
Was Du tust und was Du zeigst.
Baue ein extraktives Open-Domain-QA-System ueber 50.000 juristische Entscheidungen mit Quellenangabe und reproduzierbarer Evaluation.
Earning criteria — what you'll demonstrate
- Klassisches Retrieve-then-Read-Paradigma implementieren und evaluieren
- BM25-Indexierung und Passage-Tokenisierung fuer lange juristische Dokumente gestalten
- Extraktive Reader-Modelle mit Span-Scoring auf realer QA-Pipeline einsetzen
- Quellenrueckverfolgbarkeit als first-class-Metrik etablieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP Engineer
Open-Domain-QA mit Retrieve-then-Read auf einer realen Domaene zu liefern und gegen Source-Recall zu validieren ist die Standardarbeit eines NLP Engineers in Legal-Tech oder Enterprise-Search.
Dieses Projekt schärft
- open-domain-qa
- bm25-retrieval
- extractive-qa
AI Engineer
Einen FastAPI-Service mit Latenz-Profil und Eval-Suite zu paketieren ist die Tag-eins-Arbeit eines AI Engineers in einem KI-getriebenen B2B-Produkt.
Dieses Projekt schärft
- python
- evaluation-design
- passage-ranking
Machine Learning Engineer
Ein Retrieval-plus-Reader-System mit klaren Metriken in Produktion zu bringen ist Kerngebiet von ML Engineers in Search- und QA-Teams.
Dieses Projekt schärft
- passage-ranking
- extractive-qa
- evaluation-design
Noch eine Sache