Tabla hash para deduplicar registros de pacientes en clínica
Visión general
De qué trata este proyecto.
Implementa en Java o Python una tabla hash con encadenamiento separado (separate chaining), redimensionado dinámico al superar factor de carga 0,75 y una función hash adecuada. Diseña una función de normalización para nombres en español (NFKD para acentos, minúsculas, eliminación de prefijos comunes 'de la', 'del'). Evalúa empíricamente factor de carga vs tiempo medio de búsqueda. Aplica la estructura para deduplicar 280.000 registros y produce un reporte con duplicados detectados y casos dudosos para revisión manual. Entrega el código, las pruebas y un informe de 10 páginas.
El Briefing
Lo que harás y lo que demostrarás.
Detectar duplicados de pacientes en 280.000 registros con una tabla hash auto-implementada y normalización robusta para nombres en español, dejando log auditable.
Earning criteria — what you'll demonstrate
- Implementar tabla hash con encadenamiento y redimensionado dinámico
- Diseñar funciones de normalización robustas para idioma español
- Argumentar empíricamente factor de carga óptimo
- Entregar deduplicación con trazabilidad para uso regulado
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de Software
Implementar una tabla hash desde cero y aplicarla a un caso real con restricciones regulatorias prepara a una persona ingeniera junior para roles donde la corrección importa más que la velocidad.
Este proyecto afina
- hash-tables
- collision-resolution
- string-normalization
Ingeniero/a Backend
Las personas backend que entienden las estructuras internas que usan sus librerías toman mejores decisiones cuando el caso de uso se aleja de los benchmarks de manual.
Este proyecto afina
- hash-tables
- complexity-analysis
- unit-testing