Conecta el catálogo editorial de un grupo de medios con DBpedia y Wikidata
Visión general
De qué trata este proyecto.
Recibirás 5.000 entidades del catálogo con metadatos mínimos (nombre, tipo, contexto frase). Implementarás un pipeline de entity linking que combine búsqueda léxica (Elasticsearch contra dumps DBpedia/Wikidata) + reranking por embedding contextual + reglas de tipo. Anotarás un gold standard de 300 entidades para evaluación. Reportarás precisión, recall y errores típicos. Construirás un endpoint Python para que el CMS de la redacción reciba sugerencias en tiempo real.
El Briefing
Lo que harás y lo que demostrarás.
Alinear el catálogo editorial con DBpedia y Wikidata mediante entity linking automatizado y un endpoint para CMS.
Earning criteria — what you'll demonstrate
- Implementar entity linking combinando lexical + denso + reglas
- Consumir SPARQL endpoints públicos (DBpedia, Wikidata) con respeto
- Evaluar entity linking con gold standard anotado
- Empaquetar un servicio listo para integrarse en CMS
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniera de Procesamiento de Lenguaje Natural
Entity linking sobre Wikidata con gold standard anotado es portafolio clásico de NLP engineer aplicado a medios y editorial.
Este proyecto afina
- entity-linking
- neural-retrieval
- evaluation
Ingeniera de Datos
Alinear catálogos internos con grafos públicos es el ladrillo que data engineering provee para enriquecer datos a escala.
Este proyecto afina
- knowledge-graphs
- sparql
- entity-linking
Ingeniera de IA
Empaquetar el linker como endpoint con cache es la clase de glue work que AI engineers entregan continuamente al integrar IA en producto.
Este proyecto afina
- python
- knowledge-graphs
- neural-retrieval