Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten ein bereits trainiertes XGBoost+kleines Transformer-Hybrid-Modell und einen anonymisierten Lastprofil-Trace (rund 1.500 RPS Peak). Setzen Sie das Modell unter drei Stacks auf: (1) Triton mit ONNX-Backend, (2) TorchServe, (3) BentoML. Messen Sie p50/p95/p99-Latenz, Durchsatz unter Last, Cold-Start-Zeit und Speicher-Footprint. Verwenden Sie k6 oder Locust für synthetische Last. Erfolg ist eine vergleichbare Tabelle plus eine fundierte Empfehlung mit Migrationsaufwand-Schätzung in Personentagen.
Das Briefing
Was Du tust und was Du zeigst.
Welcher moderne Inference-Serving-Stack erfüllt das p99-Latenz-SLO der Fintech-Plattform bei realem Lastprofil am sichersten?
Earning criteria — what you'll demonstrate
- Ein produktionsnahes ML-Modell unter drei Serving-Stacks vergleichbar deployen
- Realistische Lasttests mit p99-Fokus statt Mittelwerten konzipieren
- Inference-Engpässe (CPU-Bound, GPU-Bound, Memory-Pressure) identifizieren
- Eine Plattform-Migrationsempfehlung quantitativ begründen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenMLOps-Ingenieur:in
Inference-Serving-Vergleiche mit p99-Fokus sind das tägliche Brot eines MLOps-Engineers in jedem Fintech mit Real-Time-Scoring — diese Challenge ist ein Portfolio-Beweisstück.
Dieses Projekt schärft
- model-serving
- latency-optimization
- load-testing
Machine-Learning-Ingenieur:in
Wer ein Modell durch drei Stacks treibt und Performance-Trade-offs benennen kann, ist genau die Junior-MLE-Besetzung, die Plattform-Teams 2026 einstellen wollen.
Dieses Projekt schärft
- onnx
- benchmarking
- model-serving
KI-Lösungsarchitekt:in
Die Migrationsempfehlung mit Personentage-Schätzung ist das exakte Artefakt, das Solutions Architects an die Plattform-Leitung liefern, um Architekturentscheidungen zu rechtfertigen.
Dieses Projekt schärft
- kubernetes
- benchmarking
- latency-optimization
Noch eine Sache