Construye un sistema de localización ES-PT para una scaleup de São Paulo
Visión general
De qué trata este proyecto.
Recibirás 28.000 strings PT, 400 emails y un glosario corporativo de 200 términos. Implementa: (1) pipeline de traducción con un modelo neuronal (NLLB-200 o Marian PT-ES), (2) aplicación obligatoria del glosario via term injection, (3) detección automática de strings que requieren post-edición humana (longitud anómala, baja confianza). Evalúa BLEU y COMET (Crosslingual Optimized Metric for Evaluation of Translation — métrica optimizada interlingüe para evaluación de traducción) contra una muestra humana de 500 strings. El éxito es BLEU >= 0,55 y < 15 % requieran post-edición.
El Briefing
Lo que harás y lo que demostrarás.
Construir un pipeline de localización PT-ES con BLEU >= 0,55 y < 15 % de strings que requieran post-edición humana.
Earning criteria — what you'll demonstrate
- Aplicar modelos neuronales de traducción a un caso real PT-ES
- Implementar term injection (inyección de términos) para respetar glosarios corporativos
- Evaluar traducción con métricas modernas (BLEU, COMET)
- Diseñar flujo human-in-the-loop (humano-en-el-bucle) eficiente
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosIngeniero/a de PLN
Construir pipelines de traducción con term injection es competencia altamente demandada del NLP engineer en SaaS con expansión internacional.
Este proyecto afina
- machine-translation
- localization
- nlp-spanish
Ingeniero/a de IA
Empaquetar un pipeline reproducible con detección automática de casos difíciles es trabajo del AI engineer en producción.
Este proyecto afina
- python
- transformers
- evaluation
Ingeniero/a de Machine Learning
La evaluación con BLEU/COMET y la calibración del detector de post-edición es competencia del MLE aplicado a NLP.
Este proyecto afina
- evaluation
- transformers
- machine-translation