Construye un lexicón especializado para tono de prensa en español
Visión general
De qué trata este proyecto.
Recibirás 4.000 frases anotadas (tono: positivo, neutro, negativo, con variante regional indicada). Construirás un lexicón inicial expandiendo lemas con embeddings y filtros manuales, soportando intensificadores y negación. Evaluarás contra el lexicón VADER traducido y contra un modelo Hugging Face en español. Reportarás accuracy por variante regional y por categoría de prensa (política, deporte, cultura). Entregarás el lexicón, scripts y guía de mantenimiento.
El Briefing
Lo que harás y lo que demostrarás.
Producir un lexicón de tono en español con variantes regionales que supere baselines genéricos en prensa hispana.
Earning criteria — what you'll demonstrate
- Diseñar y mantener lexicones especializados en español
- Manejar variantes regionales sin colapsarlas en "español genérico"
- Combinar reglas (intensificadores, negación) con lemas calibrados
- Evaluar contra baselines fuertes con honestidad sobre límites
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniera de Procesamiento de Lenguaje Natural
Construir lexicones especializados con variantes regionales es competencia diferencial de NLP engineers en mercados hispanos.
Este proyecto afina
- lexicon-design
- sentiment-analysis
- embeddings
Científica de Datos
Evaluación honesta contra baselines y reporte por segmento es trabajo cotidiano de data scientists en agencias de comunicación.
Este proyecto afina
- evaluation
- sentiment-analysis
- annotation-design
Ingeniera de Investigación Aplicada en IA
Diseñar artefactos lingüísticos mantenibles y defenderlos contra modelos generalistas es el aporte de applied AI scientists en medios.
Este proyecto afina
- lexicon-design
- evaluation
- python