Despliegue Multi-Región de Servicio de Inferencia para un eCommerce de Moda en Arteixo
Visión general
De qué trata este proyecto.
Despliega el servicio de inferencia (FastAPI + ONNX Runtime) en GKE en 3 regiones (europe-west1, us-east1, southamerica-east1). Configura Global External HTTPS LB con CDN y caché de embeddings en Memorystore Redis regional. Carga sintética desde 5 regiones simuladas mide latencia p50/p99 por origen. Reporta coste mensual proyectado vs single-region y propone política de scaling autonomic basada en RPS por región.
El Briefing
Lo que harás y lo que demostrarás.
Reducir la latencia mediana desde Buenos Aires y Ciudad de México por debajo de 120 ms manteniendo coste mensual proyectado dentro de 1,8 veces el baseline single-region.
Earning criteria — what you'll demonstrate
- Diseñar despliegues multi-región con load balancing global
- Aplicar caché regional para reducir latencia de inferencia
- Cuantificar trade-off coste/latencia con datos
- Definir políticas de autoscaling basadas en métricas operativas
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosArquitecto de Soluciones de IA
Diseñar despliegues multi-región con análisis honesto de coste/latencia es trabajo cotidiano del solutions architect en retail global.
Este proyecto afina
- multi-region
- load-balancing
- infrastructure-as-code
Ingeniero de MLOps
Operar servicios de inferencia multi-región con autoscaling es el músculo del MLOps engineer en producto.
Este proyecto afina
- kubernetes
- performance-engineering
- caching
Ingeniero de IA
Empacar inferencia con ONNX y exponerla a múltiples regiones es directamente el músculo del AI engineer.
Este proyecto afina
- performance-engineering
- kubernetes
- caching