Skip to contentSkip to content
Certificados verificados. En cadena. Para siempre.Más información
Cover image for Construye un buscador semántico para una biblioteca jurídica española
Code

Construye un buscador semántico para una biblioteca jurídica española

FreeVerified credential3 semanasIntermediate

Visión general

De qué trata este proyecto.

Recibirás el corpus indexable, 40 consultas reales anonimizadas de despachos y 8 juicios de relevancia (top-10 anotados) por consulta hechos por una persona jurista colaboradora. Construirás dos índices: BM25 con Elasticsearch (lexical) y vectorial con embeddings multilingües (por ejemplo, intfloat/multilingual-e5) sobre FAISS. Implementarás una capa híbrida con Reciprocal Rank Fusion (RRF). Reportarás nDCG@10, recall@10 y latencia P95. Entregarás el repositorio, el informe y una recomendación: ¿reemplazar el buscador actual o introducir el semántico como capa opcional?

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Demostrar si un buscador semántico híbrido supera al booleano actual en consultas reales de despacho con métricas estandarizadas de IR.

Earning criteria — what you'll demonstrate

  • Implementar retrieval léxico (BM25) y denso (embeddings + ANN) end-to-end
  • Combinar ambos con técnicas de fusión (RRF) y justificar el peso elegido
  • Evaluar con nDCG y recall sobre juicios de relevancia reales
  • Argumentar trade-offs latencia/calidad para una decisión de producto

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Ingeniera de Procesamiento de Lenguaje Natural

Construir un retrieval híbrido con métricas IR rigurosas es el portafolio que cualquier equipo de NLP busca cuando contrata para search.

Este proyecto afina

  • neural-retrieval
  • vector-search
  • evaluation

Ingeniera de IA

El pipeline BM25 + embeddings + fusión es exactamente el ladrillo que las AI engineers integran en RAGs y asistentes verticales.

Este proyecto afina

  • information-retrieval
  • vector-search
  • python

Ingeniera de Investigación Aplicada en IA

Evaluar con juicios de relevancia reales y producir recomendación a producto es trabajo aplicado típico para un applied AI scientist en legal-tech.

Este proyecto afina

  • information-retrieval
  • evaluation
  • bm25

Una cosa más

Puedes tener una credencial en tu CV para el viernes.