Code
Extracción de entidades y resumen automático de contratos de suministro para startup logística portuaria
Visión general
De qué trata este proyecto.
Construye un prototipo de sistema de extracción de información de documentos legales que: (1) convierta contratos de suministro en PDF a texto estructurado, (2) identifique y clasifique entidades nombradas (Named Entity Recognition, NER — técnica de NLP que detecta y categoriza elementos como personas, organizaciones, fechas, cantidades monetarias) relevantes para operaciones logísticas, (3) extraiga relaciones entre entidades (por ejemplo: 'Transportista X debe entregar volumen mínimo Y en plazo Z'), y (4) genere un resumen ejecutivo de una página por contrato con las cláusulas críticas destacadas. El sistema debe funcionar en español con tolerancia a terminología técnica logística (incoterms, tipos de vehículo, nomenclatura aduanera). El éxito se mide comparando la extracción automática contra la revisión manual histórica: el objetivo es que el equipo legal valide el resumen en menos de 5 minutos por contrato (frente a los 45 minutos actuales de lectura completa) con una tasa de error aceptable del 5% en cláusulas críticas. No se requiere procesar documentos escaneados (solo PDF nativos), pero sí documentar cómo se extendería a ese caso.
El Briefing
Lo que harás y lo que demostrarás.
¿Cómo reducir el tiempo de revisión legal de contratos de suministro de 45 a 5 minutos mediante extracción automática de entidades y generación de resúmenes ejecutivos, manteniendo una tasa de error inferior al 5% en cláusulas críticas?
Earning criteria — what you'll demonstrate
- Aplicar técnicas de reconocimiento de entidades nombradas (NER) a documentos legales en español con terminología de dominio específico
- Comparar el rendimiento de enfoques basados en reglas, modelos tradicionales de NLP y modelos de lenguaje grande (LLMs) para una tarea de extracción estructurada
- Evaluar la calidad de extracción mediante métricas de precisión, exhaustividad (recall) y medida F1 adaptadas a la relevancia de negocio de cada tipo de entidad
- Documentar las limitaciones de un prototipo de NLP y proponer un roadmap de mejora realista para una startup con recursos limitados
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Analista de Procesos de Negocio
La experiencia en mapear un proceso manual (revisión de contratos), cuantificar su ineficiencia y diseñar una solución de automatización parcial prepara para roles que optimizan operaciones mediante tecnología en empresas en crecimiento.
Este proyecto afina
- information-extraction
- document-processing
- python-programming
Consultor de Transformación Digital
La capacidad de identificar cuellos de botella en startups, prototipar soluciones de NLP y documentar un roadmap de implementación realista con recursos limitados es central en consultoría de transformación digital para pymes y startups.
Este proyecto afina
- natural-language-processing
- information-extraction
- python-programming
Ingeniero de NLP
El trabajo con documentos reales, la extracción de entidades en español con terminología especializada y la evaluación de enfoques híbridos (reglas + ML + LLM) reflejan las decisiones técnicas diarias de un ingeniero de NLP en producto.
Este proyecto afina
- named-entity-recognition
- natural-language-processing
- python-programming