Pipeline de minería de texto para vigilancia de tendencias en cosmética
Visión general
De qué trata este proyecto.
Diseñarás un pipeline modular: (1) ingesta de feeds RSS y APIs públicas, (2) limpieza y deduplicación, (3) extracción de ingredientes con un NER (Named Entity Recognition, reconocimiento de entidades nombradas) afinado, (4) clasificación de sentimiento por mención, (5) agregación semanal en BigQuery o Postgres, (6) dashboard Streamlit con top ingredientes y evolución. Validarás extracción con un set de 500 frases anotadas. Entregarás pipeline reproducible y dashboard accesible.
El Briefing
Lo que harás y lo que demostrarás.
Construir un pipeline de minería de texto que extraiga menciones de ingredientes con sentimiento y produzca un dashboard semanal accionable.
Earning criteria — what you'll demonstrate
- Diseñar pipelines de minería de texto en español end-to-end
- Afinar un NER especializado en ingredientes cosméticos
- Combinar extracción + sentimiento como producto de datos
- Entregar un dashboard usable por personas no técnicas
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniera de Datos
Construir pipelines reproducibles que ingieren texto y producen dashboards es trabajo nuclear de data engineering en marcas consumer.
Este proyecto afina
- data-pipelines
- text-mining
- python
Ingeniera de Procesamiento de Lenguaje Natural
NER + sentimiento afinados al dominio es portafolio clásico de NLP engineers que entregan productos de datos accionables.
Este proyecto afina
- named-entity-recognition
- sentiment-analysis
- evaluation
Ingeniera de IA
Conectar modelos a un dashboard usable por marketing es trabajo de plomería que las AI engineers entregan continuamente.
Este proyecto afina
- text-mining
- data-pipelines
- python