Sequenz-Embedding-Service für ein Berliner Bio-Tech-Startup
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst die Modell-Wahl (esm2_t12_35M_UR50D, ein klein gehaltenes Modell für moderate Hardware), Beispiel-Sequenz-Datensätze (UniProt-Subset mit rund 50.000 Sequenzen) und eine grobe Anforderungsspezifikation. Baue einen FastAPI-Service mit drei Endpunkten: /embed (Sequenz zu Vektor), /index (Sequenz speichern), /search (Top-K ähnlichste Sequenzen). Implementiere ein Redis-basiertes Cache für /embed mit SHA-256-Schlüssel. Stelle Container und docker-compose-Setup bereit, schreibe pytest-Tests und führe einen Lasttest mit Locust durch (Ziel: 50 Anfragen pro Sekunde p95 unter 400 ms). Liefere den Code, einen 5-seitigen Architekturbericht und einen 15-minütigen Walkthrough.
Das Briefing
Was Du tust und was Du zeigst.
Wie wird ein Protein-Embedding-Service gebaut, der auf bescheidener Hardware 50 Anfragen pro Sekunde mit p95 unter 400 ms bedient und eine Ähnlichkeitssuche über 50.000 Sequenzen anbietet?
Earning criteria — what you'll demonstrate
- Vortrainierte Sequenzmodelle in produktionsnahen Services einbetten
- Cache-Schichten für teure Inferenz-Aufrufe systematisch entwerfen
- Vektor-Datenbanken für Ähnlichkeitssuche praktisch betreiben
- Last- und Latenz-Anforderungen messbar und reproduzierbar erfüllen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenSoftware Engineer
Produktionsreife Services für Bioinformatik-Modelle sind eine seltene Kombination aus ML-Stack-Wissen und Software-Disziplin — Software Engineers mit dieser Erfahrung qualifizieren sich für anspruchsvolle Plattform-Rollen.
Dieses Projekt schärft
- embedding-models
- python
- fastapi
Noch eine Sache