Benchmarking de Inferencia con Vectorización en Edtech Argentina
Visión general
De qué trata este proyecto.
Recibes el binario de inferencia (PyTorch + onnxruntime), modelos de tres tamaños (small, medium, large) y dos tipos de instancia EC2 (m6i con AVX2 y m7i con AVX-512). Mide el techo de rendimiento con un modelo roofline sencillo basado en FLOPs por byte. Compara rendimiento con onnxruntime CPU EP, OpenVINO y un baseline naive. Evalúa el efecto de AVX-512, batch sizing y threading. Construye una curva coste-rendimiento por instancia y un plan de despliegue. Entrega los scripts de benchmark, el modelo roofline en cuaderno Jupyter, la curva y un memo de 5 páginas para la directora técnica.
El Briefing
Lo que harás y lo que demostrarás.
Caracterizar el techo de rendimiento de inferencia CPU con roofline, comparar runtimes vectorizados y producir un plan de despliegue con coste por millón.
Earning criteria — what you'll demonstrate
- Aplicar el modelo roofline a un workload real de inferencia
- Medir el impacto efectivo de AVX2 vs AVX-512 con datos
- Construir curvas coste-rendimiento defendibles
- Recomendar instancia y configuración basada en evidencia
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Backend
Backend engineers con experiencia en runtime de inferencia construyen servicios que escalan sin sorpresas en la factura cloud.
Este proyecto afina
- onnxruntime
- benchmarking
- performance-engineering