Comprensión Anclada (Grounded Understanding) en Catálogos de eCommerce Mexicano
Visión general
De qué trata este proyecto.
Recibes 5.000 descripciones de producto anotadas con sus atributos normalizados (dimensiones en cm, color en paleta de 24 valores, material en taxonomía de 15 valores). Construye un pipeline con NER + normalización por reglas + LLM como fallback para casos ambiguos. Evalúa F1 por atributo, separando casos fáciles vs ambiguos. Entrega comparativa con un baseline LLM puro.
El Briefing
Lo que harás y lo que demostrarás.
Construir un extractor de atributos con F1 superior al 80% por atributo y latencia inferior a 200 ms por producto en CPU.
Earning criteria — what you'll demonstrate
- Aplicar comprensión anclada a una ontología real
- Combinar NER, reglas y LLM en un pipeline pragmático
- Evaluar separando casos fáciles vs ambiguos
- Diseñar un sistema con latencia objetivo en CPU
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Procesamiento de Lenguaje Natural
Construir comprensión anclada en una ontología real es trabajo cotidiano del NLP engineer en marketplaces y catálogos.
Este proyecto afina
- grounded-language-understanding
- named-entity-recognition
- normalization
Ingeniero de IA
Combinar reglas, modelos y LLM en un pipeline con latencia objetivo es el músculo del AI engineer.
Este proyecto afina
- python
- llm-prompting
- normalization
Ingeniero de Aprendizaje Automático
Evaluar separando casos fáciles vs ambiguos es práctica clave del MLE junior en producto.
Este proyecto afina
- named-entity-recognition
- evaluation
- python