Búsqueda y ranking para clasificados de vehículos usados
Visión general
De qué trata este proyecto.
Trabajarás con 800.000 documentos de anuncios (texto + atributos), 4 meses de logs de búsqueda con clicks anonimizados y consultas reales muestreadas. Indexa con OpenSearch usando BM25, define analizadores en español, sinónimos de marca y manejo de errores tipográficos comunes. Entrena un reordenador de gradient boosting (LightGBM Ranker) sobre pares consulta-documento con etiquetas implícitas (clicks). Evalúa con MRR y NDCG@10 sobre split temporal. Entrega el código, el plan de despliegue con presupuesto de latencia y un informe de 12 páginas.
El Briefing
Lo que harás y lo que demostrarás.
Mejorar MRR del buscador en al menos un 25 por ciento manteniendo p95 menor a 220 ms con un sistema BM25 + reordenador aprendido.
Earning criteria — what you'll demonstrate
- Diseñar pipelines de IR (Information Retrieval — recuperación de información) en producción con BM25
- Entrenar y evaluar learning-to-rank con etiquetas implícitas
- Equilibrar recall léxico y precisión de reordenador bajo presupuesto de latencia
- Diagnosticar fallas de búsqueda con análisis cualitativo de consultas
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a Backend
Construir búsqueda real con BM25 + reordenador y demostrar mejoras con presupuesto de latencia es exactamente el ejercicio que distingue a personas backend orientadas a producto.
Este proyecto afina
- information-retrieval
- bm25
- opensearch
Ingeniero/a de Aprendizaje Automático
Las personas ML que entienden learning-to-rank con etiquetas implícitas son la pieza que vuelve útil la inversión en infraestructura de búsqueda.
Este proyecto afina
- learning-to-rank
- feature-engineering
- data-mining
Ingeniero/a de Datos
Quien construye datasets de evaluación reutilizables y pipelines de logs reproducibles es la columna vertebral de cualquier equipo de búsqueda serio.
Este proyecto afina
- data-mining
- feature-engineering
- information-retrieval