Dense Retrieval mit DPR fuer technische Wissensbasis eines Erlanger Maschinenbauers
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst 180.000 Passagen plus 800 historische Frage-Loesung-Paare als Ground Truth. Implementiere: (1) Bi-encoder-Training (z. B. Sentence-BERT oder ein deutsch-englisches Modell) auf den 800 Paaren plus In-Batch-Negatives, (2) Indexierung mit FAISS oder einer dedizierten Vektor-DB, (3) Vergleich gegen BM25 als Baseline ueber Recall@1, @5, @20. Liefere eine FastAPI-Schnittstelle, einen Eval-Bericht und einen Spickzettel fuer Servicetechniker, wie sie Fragen formulieren sollten.
Das Briefing
Was Du tust und was Du zeigst.
Baue ein DPR-basiertes semantisches Retrieval ueber eine technische Wissensbasis und uebertreffe BM25 deutlich in Recall@5.
Earning criteria — what you'll demonstrate
- Dense Retrieval mit bi-encoder-Architekturen entwerfen und trainieren
- Vektor-Indizes effizient aufbauen und abfragen
- Semantisches Retrieval gegen klassisches BM25 ehrlich vergleichen
- Retrieval-Qualitaet als first-class-Produktmetrik berichten
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP Engineer
Dense Retrieval mit bi-encoder-Training und FAISS-Indexing zu liefern ist Kerngebiet von NLP Engineers in Enterprise-Search-Teams.
Dieses Projekt schärft
- dense-retrieval
- embedding-models
- vector-search
AI Engineer
Retrieval-Pipelines mit FastAPI-Bindung und Latenzbudget zu paketieren ist die Tag-eins-Arbeit eines AI Engineers in einem produktnahen Search-Team.
Dieses Projekt schärft
- vector-search
- python
- passage-ranking
Machine Learning Engineer
Encoder-Training mit Negativ-Sampling-Strategie und ablation studies durchzufuehren ist klassische ML-Engineer-Arbeit in Search- und Recommender-Teams.
Dieses Projekt schärft
- embedding-models
- evaluation-design
- passage-ranking
Noch eine Sache