MapReduce vs. Spark Modernisierung bei einem Hamburger Hafen-Logistiker
Übersicht
Worum es bei diesem Projekt geht.
Inventarisiere alle 22 MapReduce-Jobs (Code-Reviews, Job-Logs, Datenfluss-Diagramme). Identifiziere die zwei kritischsten (höchste Laufzeit, häufigste Fehler) und schreibe sie nach PySpark um. Vergleiche Laufzeit, Speicher, Code-Komplexität und Operations-Kosten gegen die Hadoop-Baseline auf identischen Datensätzen. Erstelle eine Migrations-Empfehlung über drei Wellen mit Aufwand- und Risiko-Schätzung. Liefere 14-seitigen Vergleichsbericht, PySpark-Code und Migrations-Roadmap.
Das Briefing
Was Du tust und was Du zeigst.
Belege empirisch, ob ein Refactoring der 22 MapReduce-Jobs auf Spark messbaren Wert liefert — auf Basis von zwei vollständig migrierten Pilot-Jobs.
Earning criteria — what you'll demonstrate
- MapReduce- und Spark-Programmiermodelle fachlich gegenüberstellen
- Reale Jobs zwischen den Paradigmen sauber portieren
- Performance- und TCO-Vergleiche zwischen Daten-Stacks methodisch durchführen
- Migrations-Roadmaps für regulierte Workloads konkret planen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNoch eine Sache