Detección de coordinación inauténtica en X durante elecciones locales
Visión general
De qué trata este proyecto.
Procesa el dataset de 2 M tuits (provisto en parquet, anonimizado a nivel cuenta-hash). Construye con Python una pipeline que: (1) detecte similitud temporal anómala (cuentas que postean en ventanas de menos de 60 segundos repetidamente), (2) detecte similitud textual (Jaccard, MinHash) en cadenas amplificadas, (3) construya un grafo cuenta-cuenta y aplique detección de comunidades, (4) filtre por umbrales transparentes y métricas de robustez. Identifica las 5 redes más probables, audita 50 cuentas a mano por red para estimar falsos positivos. Entrega: pipeline reproducible, dossier de 5 redes (15 páginas), metodología pública (8 páginas), 3 visualizaciones y artículo principal (1.500 palabras).
El Briefing
Lo que harás y lo que demostrarás.
Detectar y publicar 5 redes probables de coordinación inauténtica en X con metodología auditable, estimando explícitamente la tasa de falsos positivos.
Earning criteria — what you'll demonstrate
- Aplicar técnicas de coordinación inauténtica con rigor periodístico
- Combinar similitud temporal y textual para reducir falsos positivos
- Construir auditoría manual sobre muestras representativas
- Comunicar metodología en lenguaje que sobreviva escrutinio público
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosData Scientist
Aplicar network science a 2 M de tuits con rigor publicable es el perfil del data scientist en redacciones de datos y observatorios — un nicho creciente en medios hispanos independientes.
Este proyecto afina
- network-science
- anomaly-detection
- python
Software Engineer
Construir un pipeline reproducible auditable es la frontera entre script de redacción y herramienta reusable — competencia que mueve al software engineer aplicado a roles de investigación cívica.
Este proyecto afina
- python
- minhash
- computational-journalism