Skip to contentSkip to content
Certificados verificados. En cadena. Para siempre.Más información
Cover image for Despliegue Multi-Región de Servicio de Inferencia para un eCommerce de Moda en Arteixo
Code

Despliegue Multi-Región de Servicio de Inferencia para un eCommerce de Moda en Arteixo

FreeVerified credential3 semanasAdvanced

Visión general

De qué trata este proyecto.

Despliega el servicio de inferencia (FastAPI + ONNX Runtime) en GKE en 3 regiones (europe-west1, us-east1, southamerica-east1). Configura Global External HTTPS LB con CDN y caché de embeddings en Memorystore Redis regional. Carga sintética desde 5 regiones simuladas mide latencia p50/p99 por origen. Reporta coste mensual proyectado vs single-region y propone política de scaling autonomic basada en RPS por región.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Reducir la latencia mediana desde Buenos Aires y Ciudad de México por debajo de 120 ms manteniendo coste mensual proyectado dentro de 1,8 veces el baseline single-region.

Earning criteria — what you'll demonstrate

  • Diseñar despliegues multi-región con load balancing global
  • Aplicar caché regional para reducir latencia de inferencia
  • Cuantificar trade-off coste/latencia con datos
  • Definir políticas de autoscaling basadas en métricas operativas

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Arquitecto de Soluciones de IA

Diseñar despliegues multi-región con análisis honesto de coste/latencia es trabajo cotidiano del solutions architect en retail global.

Este proyecto afina

  • multi-region
  • load-balancing
  • infrastructure-as-code

Ingeniero de MLOps

Operar servicios de inferencia multi-región con autoscaling es el músculo del MLOps engineer en producto.

Este proyecto afina

  • kubernetes
  • performance-engineering
  • caching

Ingeniero de IA

Empacar inferencia con ONNX y exponerla a múltiples regiones es directamente el músculo del AI engineer.

Este proyecto afina

  • performance-engineering
  • kubernetes
  • caching

Una cosa más

Puedes tener una credencial en tu CV para el viernes.