Skip to contentSkip to content
Certificados verificados. En cadena. Para siempre.Más información
Cover image for Construye un anonimizador de transcripciones clínicas en español
Code

Construye un anonimizador de transcripciones clínicas en español

FreeVerified credential3 semanasAdvanced

Visión general

De qué trata este proyecto.

Recibirás 3.000 transcripciones anonimizadas parcialmente para uso académico, con anotaciones de entidades sensibles. Construirás un sistema que combine spaCy ES + un modelo afinado RoBERTa-ES + reglas regex para identificadores numéricos y fechas. Evaluarás recall (lo crítico aquí) y precisión por tipo de entidad. Diseñarás reemplazo determinístico por placeholder consistente (PERSONA_001 reemplaza siempre al mismo nombre dentro de una nota). Entregarás sistema, evaluación y guía de uso conforme a RGPD.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Anonimizar transcripciones clínicas en español con recall >= 0.98 en categorías críticas y reemplazos consistentes intra-documento.

Earning criteria — what you'll demonstrate

  • Construir sistemas de anonimización que priorizan recall sobre precisión
  • Combinar NER neuronal y reglas para máxima cobertura
  • Diseñar reemplazo consistente para preservar utilidad investigadora
  • Documentar riesgos residuales conforme a RGPD y comité ético

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Ingeniera de Procesamiento de Lenguaje Natural

Sistemas de anonimización clínica con NER + reglas son competencia altamente valorada de NLP engineers en salud digital.

Este proyecto afina

  • named-entity-recognition
  • privacy-engineering
  • evaluation

Investigadora de Seguridad de IA

Priorizar recall sobre precisión y documentar riesgos residuales para comité ético es trabajo nuclear de safety researchers en sector regulado.

Este proyecto afina

  • privacy-engineering
  • evaluation
  • human-in-the-loop

Ingeniera de Datos

Anonimización reproducible y consistente es prerequisito para que data engineering pueda compartir datasets entre equipos.

Este proyecto afina

  • python
  • privacy-engineering
  • regex

Una cosa más

Puedes tener una credencial en tu CV para el viernes.