Diagnosticar contención NUMA en un sistema multicore de inferencia
Visión general
De qué trata este proyecto.
Recibirás acceso remoto a un servidor de prueba idéntico (2 sockets Xeon Gold, 56 núcleos físicos, 256 GB RAM) con la carga real de inferencia (binarios + datos sintéticos representativos). Caracteriza el problema con numastat, perf c2c, perf mem y likwid; identifica si la contención es por bandwidth de QPI/UPI, false sharing o thrashing de caché. Propón 3 mitigaciones candidatas (por ejemplo numactl --interleave, pinning con taskset/cgroups, replicación de datos hot por socket). Mide cada mitigación con tiempo total, throughput y eficiencia energética. Entrega el script de caracterización, el informe de 7 páginas con datos y la recomendación priorizada.
El Briefing
Lo que harás y lo que demostrarás.
Diagnosticar y mitigar contención NUMA en un servidor multicore de inferencia para recuperar al menos un 20% de rendimiento sin reescribir el solver.
Earning criteria — what you'll demonstrate
- Aplicar herramientas de profiling de SO a un problema NUMA real
- Distinguir contención de bandwidth de false sharing y de thrashing de caché
- Diseñar e instrumentar mitigaciones con afinidad de hilos y políticas de memoria
- Comunicar mejoras de rendimiento con datos comparables y honestos
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Software
Diagnosticar contención NUMA con herramientas reales y producir mejoras medibles es un tipo de trabajo de sistemas que abre puertas en HPC, motores de inferencia y bases de datos.
Este proyecto afina
- performance-analysis
- numa
- systems-programming
Arquitecto de Sistemas
Quien entiende NUMA decide bien sobre topología hardware, colocación de servicios y arquitectura de servidores en cloud privado.
Este proyecto afina
- os-for-multicore
- numa
- operating-systems