Parallel-Performance-Engineering einer Bayreuther Materialforschungs-Simulation
Übersicht
Worum es bei diesem Projekt geht.
Profile die heutige OpenMP-parallelisierte DFT-Simulation auf einem 64-Kern-AMD-EPYC-Server. Identifiziere die drei Effizienz-Killer (typische Kandidaten: False-Sharing auf einer Akkumulator-Variable, schlechte NUMA-Lokalität bei großen Matrizen, Critical-Section-Lawinen bei Reduction). Implementiere drei Optimierungen: (1) Padding gegen False-Sharing, (2) NUMA-bewusste Speicher-Allokation mit numactl/libnuma, (3) OpenMP-Reduction statt expliziter Critical-Section. Vermess Skalierung von 1 bis 64 Threads vorher/nachher. Schreibe eine technische Bewertung mit Empfehlungen für Cloud-Instanz-Auswahl. Abgaben: Profil-Bericht, drei Optimierungen, Skalierungs-Bericht vorher/nachher, 10-seitige Bewertung.
Das Briefing
Was Du tust und was Du zeigst.
Wie hebt man die parallele Effizienz einer DFT-Simulation auf 64 Kernen von rund 35 auf mindestens 70 Prozent — und welche NUMA-Strategie ist die wirtschaftlich beste?
Earning criteria — what you'll demonstrate
- OpenMP-Performance-Engineering auf modernen NUMA-Architekturen umsetzen
- False-Sharing als unsichtbare Effizienz-Bremse erkennen und mitigieren
- NUMA-bewusste Speicher-Allokation für reale Workloads anwenden
- Parallele Effizienz auf Cloud-Instanzen wirtschaftlich denken
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Parallel-Performance-Ingenieur:in
Parallele Effizienz auf NUMA-Architekturen optimieren zu können ist eine seltene Senior-Fähigkeit, die Wissenschafts-Software-Anbieter und HPC-Cloud-Anbieter aggressiv suchen.
Dieses Projekt schärft
- parallel-performance
- openmp
- numa-awareness
Noch eine Sache