Búsqueda vectorial a escala para catálogo de gran retailer
Visión general
De qué trata este proyecto.
Recibes un subconjunto representativo de 2 millones de productos con descripciones multilingües (español, inglés, portugués), 30.000 consultas de búsqueda anonimizadas con clics asociados, y un cluster con 4 GPUs. Genera embeddings con un modelo multilingüe abierto (sentence-transformers multilingüe sirve), indexa con FAISS o Milvus, y evalúa con dos métricas: recall@10 sobre consultas etiquetadas y latencia del percentil 95. Compara con la búsqueda actual. El éxito es ≥ 12 % de mejora en recall@10 con latencia P95 < 80 ms a la escala completa.
El Briefing
Lo que harás y lo que demostrarás.
Demostrar que la búsqueda vectorial multilingüe supera la búsqueda actual basada en palabras clave en relevancia y mantiene latencias aceptables a la escala completa.
Earning criteria — what you'll demonstrate
- Generar embeddings multilingües para búsqueda semántica
- Indexar a escala con bibliotecas de búsqueda vectorial
- Evaluar sistemas de búsqueda con métricas relevantes para retail
- Dimensionar arquitecturas para escalar de millones a decenas de millones de documentos
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de IA
Integrar embeddings multilingües con búsqueda vectorial a esta escala es trabajo cotidiano de una persona AI Engineer en empresas de retail global.
Este proyecto afina
- vector-search
- embeddings
- model-serving
Ingeniero/a de Aprendizaje Automático
Dimensionar indexación distribuida y comparar contra baselines productivos con métricas honestas es el patrón que MLEs siguen en empresas de búsqueda y recomendación.
Este proyecto afina
- distributed-indexing
- evaluation
- embeddings
Ingeniero/a de NLP
Trabajar con embeddings multilingües y evaluar relevancia textual en producción es trabajo central de una persona NLP en empresas con catálogos multilingües.
Este proyecto afina
- embeddings
- vector-search
- evaluation