Skip to contentSkip to content
Verifizierte Zertifikate. On-Chain. Für immer.Mehr erfahren
Cover image for Inference-Serving-Latenz für Berliner Fintech-Plattform
Code

Inference-Serving-Latenz für Berliner Fintech-Plattform

FreeVerified credential3 WochenAdvanced

Übersicht

Worum es bei diesem Projekt geht.

Sie erhalten ein bereits trainiertes XGBoost+kleines Transformer-Hybrid-Modell und einen anonymisierten Lastprofil-Trace (rund 1.500 RPS Peak). Setzen Sie das Modell unter drei Stacks auf: (1) Triton mit ONNX-Backend, (2) TorchServe, (3) BentoML. Messen Sie p50/p95/p99-Latenz, Durchsatz unter Last, Cold-Start-Zeit und Speicher-Footprint. Verwenden Sie k6 oder Locust für synthetische Last. Erfolg ist eine vergleichbare Tabelle plus eine fundierte Empfehlung mit Migrationsaufwand-Schätzung in Personentagen.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

Das Briefing

Was Du tust und was Du zeigst.

Welcher moderne Inference-Serving-Stack erfüllt das p99-Latenz-SLO der Fintech-Plattform bei realem Lastprofil am sichersten?

Earning criteria — what you'll demonstrate

  • Ein produktionsnahes ML-Modell unter drei Serving-Stacks vergleichbar deployen
  • Realistische Lasttests mit p99-Fokus statt Mittelwerten konzipieren
  • Inference-Engpässe (CPU-Bound, GPU-Bound, Memory-Pressure) identifizieren
  • Eine Plattform-Migrationsempfehlung quantitativ begründen

Studienpassung

Wo dies in Dein Studium passt.

Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.

Fähigkeiten

Fähigkeiten, die Du unter Beweis stellst.

Jede taucht auf Deinem verifizierten Zertifikat auf.

Karrieren

Berufe, auf die dies Dich vorbereitet.

Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.

Karrierewege, die das aufbaut

Kanonische Rollen

MLOps-Ingenieur:in

Inference-Serving-Vergleiche mit p99-Fokus sind das tägliche Brot eines MLOps-Engineers in jedem Fintech mit Real-Time-Scoring — diese Challenge ist ein Portfolio-Beweisstück.

Dieses Projekt schärft

  • model-serving
  • latency-optimization
  • load-testing

Machine-Learning-Ingenieur:in

Wer ein Modell durch drei Stacks treibt und Performance-Trade-offs benennen kann, ist genau die Junior-MLE-Besetzung, die Plattform-Teams 2026 einstellen wollen.

Dieses Projekt schärft

  • onnx
  • benchmarking
  • model-serving

KI-Lösungsarchitekt:in

Die Migrationsempfehlung mit Personentage-Schätzung ist das exakte Artefakt, das Solutions Architects an die Plattform-Leitung liefern, um Architekturentscheidungen zu rechtfertigen.

Dieses Projekt schärft

  • kubernetes
  • benchmarking
  • latency-optimization

Noch eine Sache

Du kannst ein Zertifikat bis Freitag in Deinem Lebenslauf haben.