AI Engineering
Ingeniero/a de NLP
El lenguaje es desordenado. La gente escribe mal, se contradice, pregunta lo mismo de cinco formas diferentes y espera que una máquina lo entienda. Los ingenieros de NLP construyen los sistemas que lo intentan.
El rol abarca desde el procesamiento clásico de texto en spaCy hasta arquitecturas modernas de recuperación aumentada ensambladas con LangChain, y las constantes decisiones sobre cuándo ajustar un modelo, cuándo usar un prompt y cuándo recurrir a reglas. Recompensa a quienes aman tanto la lingüística como el pensamiento sistémico. Los estudiantes crecen en este rol a través de pequeños proyectos —un bot de preguntas y respuestas sobre sus apuntes, un clasificador para su bandeja de entrada— que revelan los modos reales de fallo de los modelos de lenguaje.
Un buen ingeniero de NLP se obsesiona tanto con la evaluación como con la arquitectura.
- CodeIntermedioNuevo
Parser Semántico para Búsqueda Jurisprudencial en una Legaltech de Madrid
Recibes 1.200 consultas reales anotadas con su forma lógica objetivo (estilo SQL-like con predicados de materia, periodo, instancia y partes). Diseña dos enfoques: (1) parsing s…
- Semantic Parsing
- Lambda Calculus
- LLM Prompting
Computational Semantics - AnalysisPrincipianteNuevo
Analiza sentimiento sobre reseñas turísticas en Mallorca y Cancún
Recibirás 8.000 reseñas en español de hoteles en Mallorca y Cancún, con 1.200 anotadas por aspecto+sentimiento. Implementa un modelo ABSA: extracción de aspectos (limpieza, ubic…
- Sentiment Analysis
- Aspect Based Analysis
- NLP Spanish
Natural Language Processing - ResearchPrincipianteNuevo
Análisis de sentimiento de noticias para una gestora de activos
Recibes dos años de noticias financieras (titular + lead) etiquetadas por compañía para cien empresas del índice europeo de referencia. Construye un pipeline que clasifique cada…
- Procesamiento De Lenguaje Natural (NLP)
- Text Classification
- Hugging Face Transformers
AI and Quantitative Finance - CodeIntermedioNuevo
Adaptación de un reconocedor neuronal al español rioplatense para asistente bancario
Recibes un modelo base abierto (Whisper small en español o un Wav2Vec2 fine-tuneado al español), un dataset interno anonimizado de 60 horas de audio rioplatense con transcripcio…
- Speech Recognition
- Fine Tuning
- Fine Tuning
Speech Recognition and Spoken Language Processing Practice your coursework on real scenarios.
Every challenge is shaped from real-world context — not generic exercises. The work mirrors what your degree prepares you for.
Why Ewance
- CodeIntermedioNuevo
Diarización y resúmenes para un call center de salud en Bogotá
Recibes 200 llamadas anonimizadas de duración media de 5 minutos. Implementa el pipeline en tres etapas: (1) diarización con pyannote.audio o un modelo equivalente, (2) transcri…
- Speaker Diarization
- Speech Recognition
- Summarization
Speech Recognition and Spoken Language Processing - ResearchPrincipianteNuevo
Construye un lexicón especializado para tono de prensa en español
Recibirás 4.000 frases anotadas (tono: positivo, neutro, negativo, con variante regional indicada). Construirás un lexicón inicial expandiendo lemas con embeddings y filtros man…
- Lexicon Design
- Sentiment Analysis
- Evaluation
Linguistic Engineering and Language Technologies - CodeIntermedioNuevo
Construye un sistema de localización ES-PT para una scaleup de São Paulo
Recibirás 28.000 strings PT, 400 emails y un glosario corporativo de 200 términos. Implementa: (1) pipeline de traducción con un modelo neuronal (NLLB-200 o Marian PT-ES), (2) a…
- Machine Translation
- NLP Spanish
- Hugging Face Transformers
Natural Language Processing - CodeIntermedioNuevo
Transcribe y analiza llamadas de soporte con un encoder + decoder
Recibirás 4.000 llamadas anonimizadas en español (8 segundos a 12 minutos) con etiquetas de motivo (12 categorías) y sentimiento (positivo/neutro/negativo). Implementa el pipeli…
- Asr
- Whisper
- Hugging Face Transformers
Deep Learning - Browse challenges
Explore role
Product Manager
Ship product that solves real user problems. Combine user research, prototyping, and stakeholder alignment to turn ambiguous briefs into measurable wins — the role at the centre of modern software teams.
- CodePrincipianteNuevo
Re-ranqueador neuronal para búsqueda interna en intranet farmacéutica
Recibirás un dump anonimizado del corpus, 60 consultas reales y juicios de relevancia top-10 por consulta. Construirás un cross-encoder de re-ranking (por ejemplo, ms-marco-Mini…
- Neural Retrieval
- Reranking
- Bm25
Information Retrieval and Search - CodeIntermedioNuevo
Construye un modelo seq2seq para subtitular vídeos cortos de moda
Recibes 800 vídeos cortos en español castellano (15-60 s) con subtítulos de referencia en portugués brasileño. Construye un pipeline: Whisper-medium → mBART o NLLB-200 (No Langu…
- Etiquetado De Secuencias
- Multimodal
- Speech Recognition
Machine Perception - CodeIntermedioNuevo
DPO para Tono de Marca en E-commerce de Moda en Bogotá
Recibirás ~6.000 pares de preferencia anotados por equipo de marca (respuesta A preferida a respuesta B) y un modelo SFT base. Aplica DPO con parámetro beta adecuado, registra c…
- Dpo
- Preference Optimization
- LLM Alignment
Fine-Tuning Large Language Models - CodeIntermedioNuevo
Conecta el catálogo editorial de un grupo de medios con DBpedia y Wikidata
Recibirás 5.000 entidades del catálogo con metadatos mínimos (nombre, tipo, contexto frase). Implementarás un pipeline de entity linking que combine búsqueda léxica (Elasticsear…
- Entity Linking
- Knowledge Graphs
- Sparql
Knowledge Graphs and Semantic Web Build a verifiable portfolio.
Submissions become evidence. Reviewers with shipping experience score against a rubric; the result becomes a credential anyone can verify.
Why Ewance
- CodePrincipianteNuevo
Construye un asistente de soporte en español para una fintech bogotana
Recibirás 1.500 conversaciones anonimizadas y un catálogo de 90 plantillas de respuesta. Implementa: (1) clasificador de intent en español (BETO o XLM-RoBERTa) con 12 intents, (…
- Intent Classification
- Arquitecturas RAG
- NLP Spanish
Natural Language Processing - CodePrincipianteNuevo
Construye un clasificador de reseñas con transformers para una marketplace LATAM
Recibirás 60.000 reseñas en español anonimizadas etiquetadas por tema (multi-label, una reseña puede tocar varios temas) y sentimiento (multi-clase). Fine-tunea un encoder trans…
- Hugging Face Transformers
- Fine Tuning
- Multi Task Learning
Deep Learning - CodeIntermedioNuevo
Sistema de Preguntas Sobre Documentación Técnica para una SaaS de Valencia
Recibes la documentación oficial (PDFs y Markdown) y 300 preguntas históricas con respuesta de referencia escrita por soporte humano. Diseña el pipeline RAG: chunking sensato (p…
- Arquitecturas RAG
- Word Embeddings
- LLM Prompting
Computational Semantics - CodeIntermedioNuevo
Diseña un sistema de question answering para una aseguradora valenciana
Recibirás los 3.800 documentos anonimizados más 400 preguntas anotadas con la respuesta y el span correcto. Implementa: (1) recuperador BM25 + multilingual-e5 sobre chunks de 30…
- Question Answering
- Arquitecturas RAG
- Hugging Face Transformers
Neural Networks for NLP - CodeIntermedioNuevo
RAG legal con re-ranking sobre 50k cláusulas anonimizadas
En equipo de 2, recibes 50k cláusulas etiquetadas por tipo (jurisdicción, indemnización, exclusividad, etc.) y 120 consultas reales de abogados con el precedente-oro. Implementa…
- Arquitecturas RAG
- Re Ranking
- Embedding Retrieval
Retrieval-Augmented Generation - CodeIntermedioNuevo
QA de dominio abierto sobre normativa fiscal LATAM
En equipo de 2-3, recibes un corpus de 45.000 documentos categorizados por país (MX, CO, PE, AR, CL, BR) y 100 preguntas reales con respuestas-oro y país objetivo. Diseña: (1) u…
- Question Answering
- RecuperacióN De InformacióN
- Re Ranking
Question Answering and Conversational Systems - CodePrincipianteNuevo
Construye un buscador semántico para una biblioteca jurídica española
Recibirás el corpus indexable, 40 consultas reales anonimizadas de despachos y 8 juicios de relevancia (top-10 anotados) por consulta hechos por una persona jurista colaboradora…
- RecuperacióN De InformacióN
- Neural Retrieval
- Bm25
Information Retrieval and Search - CodeIntermedioNuevo
LoRA Bilingüe para Asistente Jurídico-Laboral en Barcelona
Recibirás ~12.000 pares pregunta-respuesta anonimizados de la asesoría (castellano y catalán) y acceso a una L4 alquilada. Aplica supervised fine-tuning con LoRA (rango 8-32) so…
- Fine Tuning
- Fine Tuning
- EvaluacióN De Llms
Fine-Tuning Large Language Models - CodePrincipianteNuevo
Diseña un evaluador de calidad de traducción automática para soporte
Recibirás 2.000 pares fuente/traducción etiquetados por bilingües (escala 1-5: comprensión, fluidez, registro). Construirás un evaluador que combine COMET (Cross-lingual Optimiz…
- Machine Translation Evaluation
- Evaluation
- Python O Javascript
Linguistic Engineering and Language Technologies - CodePrincipianteNuevo
Extrae cláusulas críticas de contratos con NLP supervisado
Recibirás 1.500 contratos comerciales en español anonimizados con cláusulas anotadas por jurista (spans con tipo de cláusula). Entrenarás un modelo de extracción tipo BERT (RoBE…
- Information Extraction
- Token Classification
- Pytorch O Tensorflow
Linguistic Engineering and Language Technologies - CodeIntermedioNuevo
Construye un anonimizador de transcripciones clínicas en español
Recibirás 3.000 transcripciones anonimizadas parcialmente para uso académico, con anotaciones de entidades sensibles. Construirás un sistema que combine spaCy ES + un modelo afi…
- Reconocimiento De Entidades Nombradas (Ner)
- Privacy Engineering
- Python O Javascript
Linguistic Engineering and Language Technologies - CodeIntermedioNuevo
Construye un modelo de extracción de información para una aseguradora bilbaína
Recibirás 2.500 partes anonimizados con 1.200 anotados con entidades de dominio. Implementa: (1) NER base con BETO fine-tuned, (2) NER mejorado con XLM-RoBERTa-large fine-tuned,…
- Reconocimiento De Entidades Nombradas (Ner)
- NLP Spanish
- Hugging Face Transformers
Natural Language Processing - CodeIntermedioNuevo
Fine-tunea un transformer para clasificación legal en una LegalTech madrileña
Recibirás 18.000 cláusulas anotadas con 24 categorías. Implementa: (1) baseline TF-IDF + regresión logística, (2) fine-tuning de XLM-RoBERTa-large, (3) técnicas de regularizació…
- Hugging Face Transformers
- Fine Tuning
- Text Classification
Neural Networks for NLP - CodeIntermedioNuevo
QA extractivo sobre manuales técnicos en automoción
Recibes un corpus de 12.000 PDFs ya convertidos a texto (200k passages tras chunking), 200 preguntas reales de ingenieros con la respuesta-oro y el span exacto del documento de …
- Question Answering
- Reading Comprehension
- RecuperacióN De InformacióN
Question Answering and Conversational Systems - CodePrincipianteNuevo
Pipeline de reading comprehension para customer service en e-commerce
Recibes 50.000 fichas de producto + políticas (envíos, devoluciones, garantías) y 600 consultas reales anonimizadas con respuesta-oro y span. Implementa un sistema agent-assiste…
- Reading Comprehension
- Question Answering
- RecuperacióN De InformacióN
Question Answering and Conversational Systems - CodeSéniorNuevo
RAG Multimodal para Agencia Creativa en São Paulo
Recibirás 25.000 documentos heterogéneos (PDFs, imágenes, audios cortos) y los logs de preguntas reales (anonimizadas) que los creativos hicieron al wiki interno. Diseña ingesta…
- Arquitecturas RAG
- Multimodal LLM
- Vector Databases
Generative AI - CodeIntermedioNuevo
Construye una pipeline seq2seq para corrección automática de texto en una EdTech
Recibirás 22.000 pares (texto con errores → texto corregido) en español neutro de redacciones estudiantiles. Implementa: (1) baseline con reglas + LanguageTool, (2) fine-tuning …
- Seq2seq
- Hugging Face Transformers
- Fine Tuning
Neural Networks for NLP - CodeIntermedioNuevo
Inferencia de Lenguaje Natural para Detección de Cláusulas Abusivas
Recibes 850 cláusulas reales anonimizadas y 60 criterios de abusividad redactados por abogados. Construye dos baselines NLI (regla léxica simple + modelo multilingüe MNLI tipo X…
- Natural Language Inference
- Evaluation
- LLM Prompting
Computational Semantics - CodePrincipianteNuevo
Alinea un corpus paralelo ES↔PT para una agencia de localización en Lisboa
Recibes 8.000 documentos pareados (~3,5 M oraciones por idioma). Aplica: (1) emparejado de documentos por similitud de embeddings multilingües (LaBSE o LASER), (2) alineamiento …
- Sentence Alignment
- Parallel Corpus
- Multilingual Embeddings
Machine Translation - CodePrincipianteNuevo
Clasificador de Tickets de Soporte para una SaaS de Málaga
Recibes 40.000 tickets históricos en español con la categoría asignada por agentes humanos (con ruido conocido — la propia gerencia estima un 8% de errores de etiquetado). Limpi…
- Text Classification
- Word Embeddings
- EvaluacióN De Modelos
Applied Machine Learning - ResearchIntermedioNuevo
Investiga adaptación de dominio para NLP en una startup legal de Madrid
Trabajen en equipo de 2. Reciben el modelo base (RoBERTa-base fine-tuneado), 50.000 ejemplos del dominio fuente etiquetados y 3.000 del dominio target sin etiquetar + 600 etique…
- Domain Adaptation
- Transfer Learning
- Fine Tuning
Meta-Learning, Transfer Learning, and Multi-Task Learning - CodeIntermedioNuevo
Detección de intención por voz para un asistente de hogar inteligente
Recibes un dataset interno de 22.000 enunciados de comandos de hogar (encender luces, ajustar termostato, reproducir música) etiquetados con intención y entidades, más una divis…
- Spoken Language Understanding
- Speech Recognition
- Intent Classification
Speech Recognition and Spoken Language Processing - CodeSéniorNuevo
Instruction Tuning Multimodal para Soporte Técnico en São Paulo
Recibirás ~9.000 tickets anonimizados con foto + descripción + diagnóstico humano correcto. Aplica instruction tuning sobre un VLM de 7B-9B parámetros usando LoRA. Diseña el for…
- Instruction Tuning
- Multimodal LLM
- Fine Tuning
Fine-Tuning Large Language Models - CodePrincipianteNuevo
Comprensión Anclada (Grounded Understanding) en Catálogos de eCommerce Mexicano
Recibes 5.000 descripciones de producto anotadas con sus atributos normalizados (dimensiones en cm, color en paleta de 24 valores, material en taxonomía de 15 valores). Construy…
- Grounded Language Understanding
- Reconocimiento De Entidades Nombradas (Ner)
- Normalization
Computational Semantics - CodeIntermedioNuevo
Embeddings Distribucionales en Español Médico para una Aseguradora de Salud Argentina
Recibes un corpus anonimizado de 800.000 descripciones diagnósticas en español y un conjunto de evaluación de 600 pares (descripción, código CIE-10 — Clasificación Internacional…
- Distributional Semantics
- Word Embeddings
- RecuperacióN De InformacióN
Computational Semantics - CodePrincipianteNuevo
Transcribe llamadas de soporte para una telco de Málaga
Recibes 200 llamadas anonimizadas (50 por variedad: Castilla, Andalucía, México, Colombia) con transcripción de referencia. Despliega Whisper-medium localmente, ejecuta inferenc…
- Automatic Speech Recognition
- Whisper
- Wer Evaluation
Machine Perception - AnalysisIntermedioNuevo
Curación de Dataset y Recipe-tuning para Modelo Médico-Educativo Anonimizado
Recibirás un dump bruto de ~80.000 preguntas y respuestas educativas en castellano (calidad heterogénea) y un modelo base 7B. Diseña la receta de curación: deduplicación por has…
- Dataset Curation
- Fine Tuning
- Fine Tuning
Fine-Tuning Large Language Models - ResearchPrincipianteNuevo
Evalúa modelos de MT comerciales para una plataforma turística canaria
Trabajen en equipo de 2-3. Diseñen un test set balanceado de 1.000 oraciones por par (ES↔EN, ES↔DE, ES↔FR, ES↔IT, ES↔PT, ES↔NL, ES↔SV) muestreadas del contenido real anonimizado…
- Mt Evaluation
- Bleu Evaluation
- Human Evaluation
Machine Translation - CodeIntermedioNuevo
Construye un traductor ES→EN para subtítulos de un grupo de medios en Madrid
Recibes 200.000 pares ES↔EN de subtítulos profesionales del último año (anonimizados sin datos personales). Fine-tunea NLLB-200-distilled-600M con LoRA (Low-Rank Adaptation — ad…
- Neural Machine Translation
- Fine Tuning
- Bleu Evaluation
Machine Translation
Cómo funciona
Del briefing al certificado, en seis pasos.
Paso 01
Explora retos alineados con tus estudios.
Paso 02
Acepta el que encaja con tus metas.
Paso 03
Trabájalo con la guía del AI Copilot.
Paso 04
Envíalo para una evaluación estructurada.
Paso 05
Consigue una credencial verificada.
Paso 06
Añádela a LinkedIn con un solo clic.
Roles relacionados que podrías explorar
Ver todos los roles →AI Engineering
Ingeniero/a de IA
Entre un artículo de investigación prometedor y una funcionalidad que la gente realmente usa, hay un puente largo y poco glamoroso — y los ingenieros de IA lo construyen. El trabajo consiste en tomar modelos que funcionan en notebooks y convertirlos en sistemas que resisten el tráfico real, los costos reales y los usuarios reales con preguntas desordenadas. Un buen trabajo aquí se ve como un pipeline de recuperación que acierta las respuestas un noventa y tantos por ciento de las veces, con arneses de evaluación que detectan regresiones antes de que se desplieguen. Los estudiantes crecen en este rol tratando Python y PyTorch como instrumentos en lugar de casillas de verificación, y luego aprendiendo a razonar sobre latencia, evaluación y costo en conjunto. Si disfrutas coser ideas en software funcional, este camino se sentirá como en casa.
AI Engineering
Ingeniero/a de Visión por Computador
Enseñarle a una máquina a ver es más difícil de lo que parece y más interesante de lo que aparenta. Los ingenieros de visión por computadora moldean los sistemas que leen documentos, guían autos autónomos, analizan imágenes médicas y responden preguntas sobre fotografías. El rol combina las matemáticas de la geometría multivista con el esfuerzo ingenieril de hacer que los modelos sean lo suficientemente pequeños y rápidos para ejecutarse donde se necesitan — a veces en un teléfono, a veces en un robot. Un buen trabajo aquí se ve como un pipeline que funciona bajo iluminación real, movimiento real y modos de fallo reales. Los estudiantes crecen en este camino al poner manos a la obra con OpenCV y PyTorch desde el principio, y luego aprenden el arte más difícil de optimizar modelos sin destruir silenciosamente su precisión.
AI Engineering
Ingeniero/a de Machine Learning
Un modelo que funciona en un portátil y un modelo que funciona para millones de usuarios son dos artefactos muy diferentes, y los machine learning engineers viven en el espacio entre ellos. El rol existe para convertir ML de nivel de investigación en sistemas de producción confiables, lo que implica preocuparse por la latencia, los pipelines de reentrenamiento y qué sucede cuando la distribución de datos cambia a las tres de la mañana. Los estudiantes crecen en esto a través del trabajo práctico con PyTorch o TensorFlow, más suficiente disciplina de ingeniería de software para ejecutar CI/CD real. Herramientas como AWS SageMaker se convierten en parte del flujo de trabajo. Los buenos ML engineers pueden hablar de trabajo con data scientists por un lado y con platform engineers por el otro, y esa cualidad bilingüe es a menudo lo que les consigue el empleo.
AI Engineering
Ingeniero/a de MLOps
Los modelos en producción fallan de formas más extrañas de lo que jamás lo harían en un notebook. El MLOps engineer es la persona que anticipa esos fallos y construye el andamiaje que permite que el machine learning sobreviva al contacto con usuarios reales. Piensa en feature stores que se mantienen consistentes entre el entrenamiento y el servicio, pipelines de despliegue a través de MLflow que hacen que los rollbacks sean aburridos, y observabilidad que detecta el drift antes de que los stakeholders lo noten. El trabajo se sitúa en la intersección de la ingeniería de plataformas y la ciencia de datos, y recompensa a quienes disfrutan construyendo herramientas de las que otros ingenieros dependerán. Un estudiante crece en este rol familiarizándose temprano con Kubernetes y desarrollando el criterio para saber cómo se ve realmente un sistema de ML saludable bajo carga.
AI Engineering
Ingeniero/a de Prompts
Escribir instrucciones para un modelo es un oficio nuevo y extraño. Las palabras que eliges, su orden, los ejemplos que incluyes — todo moldea lo que un sistema de varios miles de millones de parámetros hará a continuación. Los prompt engineers tratan esto como una verdadera disciplina de ingeniería: versionan prompts en herramientas como PromptLayer, ejecutan evaluaciones en miles de casos de prueba, optimizan para costo y latencia en producción, y colaboran con expertos en el dominio para codificar su criterio en texto. El rol es tan nuevo que a menudo los estudiantes ayudan a definirlo en el trabajo. Crecer en él significa desarrollar intuición sobre cómo fallan los modelos, cuándo es mejor hacer fine-tuning, y cómo redactar especificaciones lo suficientemente precisas para lanzarlas. Los buenos prompt engineers lo miden todo y confían en las corazonadas solo como punto de partida.
Equipos del sector tras una década de briefings prácticos
¿Reclutando de este grupo?
Patrocina un reto y conoce candidatos a través de su trabajo real.
Los equipos de la industria pueden diseñar briefings en torno a las habilidades que buscan, y evaluar a los estudiantes por entregables puntuados con rúbrica — no por currículums.
Las habilidades y disciplinas mostradas en esta página provienen del catálogo de retos de Ewance. Cuando el salario mediano anual para este rol esté disponible vía Adzuna, se mostrará arriba con el tamaño de la muestra y el país.
Retrato: Foto de Beatriz Cattel en Unsplash.



















































































