Hybride Suche für ein LegalTech-Such-Startup aufbauen
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst einen Korpus von 25.000 deutschsprachigen Rechtsdokumenten (anonymisiert, frei verfügbar aus offenen Bundesquellen) sowie 200 Anfragen mit Goldstandard-Treffern (drei pro Anfrage). Implementiere: (1) BM25-Baseline mit Elasticsearch oder OpenSearch; (2) dichten Retriever mit einem mehrsprachigen Modell (z. B. paraphrase-multilingual-MiniLM); (3) hybride Suche mit Reciprocal Rank Fusion. Evaluiere mit nDCG@10 (normalisierter discounted cumulative gain, Standard-Ranking-Metrik), Recall@10 und mittlerer Antwortzeit. Liefere Code, Auswertung, einen Demo-Endpoint und eine Empfehlung, welche Kombination produktiv geht.
Das Briefing
Was Du tust und was Du zeigst.
Welche Kombination aus lexikalischer und semantischer Suche liefert die beste Ranking-Qualität für deutsches Steuerrecht, ohne die Antwortzeit über 500 ms zu treiben?
Earning criteria — what you'll demonstrate
- Lexikalische und semantische Suche systematisch kombinieren
- Standard-Ranking-Metriken korrekt anwenden
- Embeddings mehrsprachig und domänenspezifisch evaluieren
- Latenz und Qualität gemeinsam als Produktentscheidung darstellen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
Hybride Suche auf einem mehrsprachigen Domänen-Korpus zu bauen und sauber zu evaluieren ist eine direkte Aufgabe von NLP-Ingenieur:innen in LegalTech und Enterprise-Search.
Dieses Projekt schärft
- information-retrieval
- dense-retrieval
- hybrid-search
Machine-Learning-Ingenieur:in
Embedding-Pipeline plus Latenz-Budget plus Failure-Analyse sind Tagesarbeit von ML-Ingenieur:innen, die produktnahe Suchsysteme verantworten.
Dieses Projekt schärft
- evaluation
- elasticsearch
- dense-retrieval
KI-Engineer
Suchdienste als Container plus Reciprocal Rank Fusion zu verschalten ist das klassische Aufgabengebiet von KI-Engineers in Produktteams.
Dieses Projekt schärft
- bm25
- hybrid-search
- information-retrieval
Noch eine Sache