Pipeline puro en OCaml para análisis genómico en CONACYT
Visión general
De qué trata este proyecto.
Modela los tipos: Lectura, ParLectura, Alineamiento, Variante. Implementa 4 etapas (control de calidad, alineamiento, llamada de variantes, anotación) como funciones puras componibles. La etapa de alineamiento puede llamar a BWA como proceso externo encapsulado. Construye un orquestador funcional que registre cada etapa con su hash de entrada/salida. Demuestra reproducibilidad en 2 máquinas distintas con el mismo dataset de ejemplo. Entrega código OCaml, ejemplo ejecutable, prueba de reproducibilidad y dossier para el grupo de investigación.
El Briefing
Lo que harás y lo que demostrarás.
Construir un pipeline genómico puro en OCaml determinista y reproducible en cualquier máquina con el mismo dataset.
Earning criteria — what you'll demonstrate
- Modelar dominio científico con ADT en lenguaje funcional
- Encapsular procesos externos manteniendo función pura observable
- Diseñar pipelines componibles con hash de etapas
- Demostrar reproducibilidad determinista de extremo a extremo
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero de Datos
Construir pipelines deterministas con tipos sólidos es la práctica que distingue a quien diseña pipelines científicos reproducibles vs scripts frágiles.
Este proyecto afina
- pipeline-design
- reproducibility
- algebraic-data-types
Ingeniero de Software
OCaml + pureza + tipos prepara a quien programa a pensar en código defendible incluso fuera de lenguajes funcionales puros.
Este proyecto afina
- ocaml
- pure-functions
- type-driven-design
Investigador Científico
Pipelines reproducibles son cada vez más exigencia de revistas científicas — competencia que abre puertas en grupos de investigación.
Este proyecto afina
- reproducibility
- pipeline-design
- ocaml