Data Science
Ingeniero de Datos
Cada dashboard inteligente, cada modelo de machine learning, cada informe ejecutivo descansa sobre una tubería que alguien construyó y mantiene. Los data engineers construyen esa tubería. Diseñan los pipelines que mueven información desde los sistemas de producción hasta los almacenes donde analistas y científicos pueden usarla, y mantienen esos pipelines confiables a medida que los volúmenes de datos crecen.
El rol es adecuado para estudiantes que disfrutan del pensamiento sistémico y se preocupan por cómo funcionan realmente las cosas bajo carga. Los días implican escribir transformaciones en dbt, programar jobs en Airflow y detectar silenciosamente datos incorrectos antes de que lleguen a un tomador de decisiones. La excelencia se muestra como pipelines que nadie nota porque nunca fallan.
Tú creces en esto escribiendo mucho SQL, aprendiendo Python y dominando en profundidad una plataforma en la nube.
US$119,658 salario mediano en United States¹
- CodeIntermedioNuevo
Análisis de Single-Cell RNA-seq para un Laboratorio de Investigación en Chile
Implementa el pipeline en Python con Scanpy: control de calidad por célula y por gen, normalización, selección de variables, integración entre muestras con scVI (Single-cell Var…
- Single Cell Genomics
- Scanpy
- Scvi
Computational Biology and Health Informatics - CodeIntermedioNuevo
Construye un grafo de conocimiento de productos farmacéuticos para farmacovigilancia
Recibirás 4 datasets en CSV (productos, lotes, indicaciones, reportes anonimizados de eventos adversos) y la guía de farmacovigilancia. Diseñarás una ontología ligera reutilizan…
- Knowledge Graphs
- Ontology Engineering
- Sparql
Knowledge Graphs and Semantic Web - CodeIntermedioNuevo
Data Lakehouse en Azure para una Bodega Acuícola en Puerto Montt
Diseña la zonas del lakehouse (bronze/silver/gold) sobre ADLS Gen2, define el esquema Delta para sensores, escribe el pipeline de migración batch para 24 meses históricos (alred…
- Data Lakehouse
- AWS O Azure
- Delta Lake
Cloud Computing for Data and ML - CodePrincipianteNuevo
Algoritmo de Reservoir Sampling para Streaming de Telemetría Médica
Implementa el Algoritmo R de Vitter y el A-Res ponderado (Efraimidis-Spirakis) en Python con tipado estático. Demuestra empíricamente sobre 5 trazas de 8M eventos cada una que l…
- Reservoir Sampling
- Streaming Algorithms
- Randomized Algorithms
Randomized Algorithms Practice your coursework on real scenarios.
Every challenge is shaped from real-world context — not generic exercises. The work mirrors what your degree prepares you for.
Why Ewance
- StrategyIntermedioNuevo
Rediseñar arquitectura de datos para fintech B2B en Ciudad de México
En equipo de 4 personas, debes analizar la arquitectura de datos actual de la fintech (te proporcionamos un esquema simplificado, ejemplos de inconsistencias y requisitos de neg…
- Data Architecture
- Etl Design
- Python Or Java
Programming for Business Applications - AnalysisFundamentosNuevo
Informe ejecutivo de inteligencia de negocio para cadena hotelera en Cancún
Trabajarás de forma individual o en pareja. Primero, analiza las tres fuentes de datos proporcionadas (datasets simulados de reservas, reputación y finanzas) e identifica qué ca…
- Data Integration
- DiseñO De Kpis Y Okrs
- VisualizacióN De Datos
Business Intelligence - CodePrincipianteNuevo
Indexa el catálogo de una biblioteca digital pública con metadatos limpios
Recibirás un dump anonimizado de 50.000 obras con metadatos en CSV. Diseñarás un pipeline de limpieza: deduplicación de autoras (Apellido, Nombre vs Nombre Apellido vs iniciales…
- Data Cleaning
- RecuperacióN De InformacióN
- Entity Resolution
Information Retrieval and Search - CodeIntermedioNuevo
Construye un pipeline de eventos de checkout para un marketplace LATAM
Recibirás un dataset de muestra con 5 millones de eventos crudos en formato JSON (pago, web, móvil) más el esquema objetivo de la tabla de hechos checkout_fact. Construye un pip…
- Apache Spark
- Dags De Airflow
- Streaming Pipelines
Data Engineering and Big Data Systems - Browse challenges
Explore role
Product Manager
Ship product that solves real user problems. Combine user research, prototyping, and stakeholder alignment to turn ambiguous briefs into measurable wins — the role at the centre of modern software teams.
- CodePrincipianteNuevo
Wearables y Salud Sensing para una Clínica de Cardiología en Lima
Ingiere datos históricos (3 meses, 180 pacientes, formato CSV anonimizado provisto). Implementa un pipeline en Python (Pandas + scikit-learn) con: (1) limpieza y resampling a 1 …
- Health Sensing
- Fundamentos De Series Temporales
- Feature Engineering
Computational Biology and Health Informatics - AnalysisPrincipianteNuevo
Las Vegas vs Monte Carlo para Selección de Pivote Robusta
Implementa ambas variantes en Python puro (sin numpy.partition). Diseña adversarios de entrada que rompen el quickselect determinista (entradas casi ordenadas, mismas claves rep…
- Randomized Algorithms
- Quickselect
- Monte Carlo
Randomized Algorithms - AnalysisIntermedioNuevo
Comparar Spark y Dask para análisis genómico a escala
Implementa las mismas 3 cargas en Spark (PySpark) y Dask: 1) join de tablas de variantes con anotaciones (250 GB), 2) ventanas estadísticas por cromosoma (100 GB), 3) entrenamie…
- Distributed Algorithms
- Parallel Algorithms
- Benchmarking
Parallel and Distributed Algorithms - CodeIntermedioNuevo
Optimización de procesamiento de datos de sensores eólicos en Pamplona
Tu equipo de tres personas debe diseñar y prototipar una migración del pipeline actual a una arquitectura de nube híbrida. Debes procesar 50 GB diarios de datos de sensores de v…
- Distributed Computing
- Cloud Migration
- Stream Processing
Big Data and Cloud Technologies Build a verifiable portfolio.
Submissions become evidence. Reviewers with shipping experience score against a rubric; the result becomes a credential anyone can verify.
Why Ewance
- DesignPrincipianteNuevo
Diseño de base de datos para trazabilidad de piezas en proveedor de automoción
Debes diseñar el esquema completo de una base de datos relacional para trazabilidad de piezas automotrices. Incluye: diagrama entidad-relación (ERD, Entity-Relationship Diagram …
- SQL
- Database Design
- Modelado De Datos
Database Systems - CodeSéniorNuevo
Plataforma de Procesamiento Stream para una Telco Mexicana
Diseña el pipeline: Kafka como bus (autogestionado o gestionado), Flink corre los jobs de detección (ventana de 5 minutos por celda, baseline EWMA — Exponentially Weighted Movin…
- Stream Processing
- Flink
- Streaming De Eventos Con Kafka
Cloud Computing for Data and ML - CodePrincipianteNuevo
Pipeline puro en OCaml para análisis genómico en CONACYT
Modela los tipos: Lectura, ParLectura, Alineamiento, Variante. Implementa 4 etapas (control de calidad, alineamiento, llamada de variantes, anotación) como funciones puras compo…
- Ocaml
- Pure Functions
- Algebraic Data Types
Functional Programming - CodeIntermedioNuevo
Pipeline de Llamada de Variantes para una CRO Farma de Madrid
Diseña el pipeline en Nextflow con DSL2: pre-procesamiento FASTQ (fastp), alineamiento a GRCh38 (bwa-mem2), marcado de duplicados (Picard MarkDuplicates), BQSR (Base Quality Sco…
- Bioinformatics
- Nextflow
- Variant Calling
Computational Biology and Health Informatics - CodeIntermedioNuevo
Implementación de ETL y dashboard de eficiencia para planta eólica en Patagonia
Trabajarás en equipo de dos personas. Primero, diseñad el flujo ETL completo: extracción de archivos CSV distribuidos, transformaciones necesarias (unificación de formatos de ti…
- Etl Design
- Dimensional Modeling
- VisualizacióN De Datos
Business Intelligence - DesignPrincipianteNuevo
Diseño de arquitectura de datos para previsión de cosechas en bodega riojana
Debes analizar los requisitos de datos de la bodega: sensores IoT con lecturas cada 15 minutos, registros de cosecha anuales desde 2008, y datos climáticos externos. Diseña una …
- Arquitectura Multi Cloud
- Nosql Design
- DiseñO De Sistemas Distribuidos
Big Data and Cloud Technologies - AnalysisPrincipianteNuevo
Diseño de almacén de datos para una bodega familiar riojana con exportación a LATAM
Debes entregar un diseño completo de almacén de datos para esta bodega, no implementarlo en código. Primero, identifica las fuentes de datos clave (ventas, inventario de barrica…
- Modelado De Datos
- Etl Design
- Dimensional Modeling
Business Intelligence - CodeIntermedioNuevo
Migración de catálogo de productos de SQL a NoSQL para marketplace B2B
Debes migrar el esquema de catálogo de una base relacional a MongoDB (base de datos NoSQL documental de código abierto). Entrega: análisis comparativo SQL vs NoSQL para este cas…
- Nosql
- Mongodb
- Data Migration
Database Systems - CodePrincipianteNuevo
Convierte una base relacional bancaria a grafo con R2RML
Recibirás el schema relacional (12 tablas) y datos de prueba anonimizados. Diseñarás un mapping R2RML que cubra las 12 tablas, lo ejecutarás con Ontop o D2RQ (ambos válidos, jus…
- R2rml
- Knowledge Graphs
- Sparql
Knowledge Graphs and Semantic Web - DesignPrincipianteNuevo
Procesamiento por lotes de logs energéticos en una utility del IBEX
Recibes un mes de eventos (cerca de 135.000 millones de registros) en formato Parquet y acceso a un cluster Spark. Diseña la arquitectura objetivo: ingesta unificada en Delta La…
- Apache Spark
- Delta Lake
- Data Engineering
Machine Learning at Scale - DesignPrincipianteNuevo
Diseña un vocabulario controlado para cultura abierta en una mediateca pública
Recibirás los 12.000 ítems con sus etiquetas de texto libre actuales. Analizarás frecuencia y co-ocurrencia para proponer un vocabulario inicial de 200 conceptos en SKOS, con re…
- Ontology Engineering
- Skos
- Vocabulary Design
Knowledge Graphs and Semantic Web - CodePrincipianteNuevo
Pipeline Reproducible de Análisis de Microcréditos en Antofagasta
Recibes la base de datos cruda (50.000 préstamos, 18 meses de pagos), el código existente en cuatro hojas Excel y la documentación parcial. Construye un pipeline en Python (carp…
- Reproducibilidad
- Data Pipelines
- Python O Javascript
Applied Data Analysis and Practical Data Science - CodePrincipianteNuevo
Pipeline de minería de texto para vigilancia de tendencias en cosmética
Diseñarás un pipeline modular: (1) ingesta de feeds RSS y APIs públicas, (2) limpieza y deduplicación, (3) extracción de ingredientes con un NER (Named Entity Recognition, recon…
- Text Mining
- Reconocimiento De Entidades Nombradas (Ner)
- Sentiment Analysis
Linguistic Engineering and Language Technologies - CodeIntermedioNuevo
I/O paralelo HDF5 para datos satelitales en investigación atacameña
Recibirás el código actual (Python serial, h5py básico) y acceso al cluster con Lustre. Implementa escritura paralela con HDF5 colectivo MPI-IO desde 16, 32, 64 procesos. Config…
- Mpi Io
- Hdf5
- Lustre
High-Performance and Scientific Computing - CodePrincipianteNuevo
Implementa observabilidad de datos para una AdTech española
Recibirás metadatos y muestras de 10 tablas críticas (logs de impresiones, clicks, conversiones, bidstream). Diseña e implementa monitores de observabilidad de datos para cuatro…
- Observabilidad De Datos
- Data Quality
- Monitoring
Data Engineering and Big Data Systems
Cómo funciona
Del briefing al certificado, en seis pasos.
Paso 01
Explora retos alineados con tus estudios.
Paso 02
Acepta el que encaja con tus metas.
Paso 03
Trabájalo con la guía del AI Copilot.
Paso 04
Envíalo para una evaluación estructurada.
Paso 05
Consigue una credencial verificada.
Paso 06
Añádela a LinkedIn con un solo clic.
Roles relacionados que podrías explorar
Ver todos los roles →Equipos del sector tras una década de briefings prácticos
¿Reclutando de este grupo?
Patrocina un reto y conoce candidatos a través de su trabajo real.
Los equipos de la industria pueden diseñar briefings en torno a las habilidades que buscan, y evaluar a los estudiantes por entregables puntuados con rúbrica — no por currículums.
¹ Salario mediano anual calculado a partir del histograma salarial de 50 ofertas de empleo actuales de Adzuna para «Ingeniero de Datos» en United States, obtenido el mayo de 2026. Las habilidades provienen de las disciplinas etiquetadas en los retos activos de Ewance para este rol.
Retrato: Foto de Kuanish Reymbaev en Unsplash.



















































































