Re-ranqueador neuronal para búsqueda interna en intranet farmacéutica
Visión general
De qué trata este proyecto.
Recibirás un dump anonimizado del corpus, 60 consultas reales y juicios de relevancia top-10 por consulta. Construirás un cross-encoder de re-ranking (por ejemplo, ms-marco-MiniLM) y lo aplicarás sobre los top-100 de BM25. Compararás nDCG@10 y latencia P95 con BM25 puro. Diseñarás también una variante "barata": un bi-encoder ligero para re-ranking que tarde 1/5 del cross-encoder. Entregarás los tres pipelines, evaluación honesta y recomendación con coste mensual estimado.
El Briefing
Lo que harás y lo que demostrarás.
Determinar si un re-ranqueador neuronal sobre BM25 mejora la búsqueda interna farmacéutica con un coste operativo aceptable on-premise.
Earning criteria — what you'll demonstrate
- Implementar y comparar reranking con cross-encoder y bi-encoder
- Medir latencia honestamente en distintos puntos del pipeline
- Estimar coste operativo en escenarios on-premise
- Defender una recomendación técnica con números, no opinión
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniera de Procesamiento de Lenguaje Natural
Reranking neuronal sobre BM25 con presupuesto de latencia y coste es la decisión clásica de NLP engineers en enterprise search.
Este proyecto afina
- reranking
- neural-retrieval
- latency-benchmarking
Ingeniera de IA
Empaquetar pipelines reproducibles y defender el coste operativo es lo que se le pide a una AI engineer al integrar IA en intranets corporativas.
Este proyecto afina
- python
- neural-retrieval
- latency-benchmarking
Ingeniera de MLOps
Pensar latencia P95 y coste mensual on-premise es trabajo nuclear de MLOps en organizaciones con restricciones de soberanía.
Este proyecto afina
- latency-benchmarking
- evaluation
- neural-retrieval