Implementa atención y compárala con seq2seq sin atención en EN→ES
Visión general
De qué trata este proyecto.
Usa un subset de TED Talks ES↔EN (200.000 pares filtrados ≤50 tokens). Implementa en PyTorch: (a) seq2seq encoder-decoder con LSTM, (b) el mismo + atención de Bahdanau. Entrena ambos con el mismo presupuesto de GPU (4 horas en una T4). Reporta BLEU, longitud media generada vs referencia, y un análisis cualitativo de 30 oraciones donde la atención claramente ayuda. Éxito: +5 BLEU para el modelo con atención y al menos 10 ejemplos donde el alineamiento de atención es interpretable visualmente.
El Briefing
Lo que harás y lo que demostrarás.
Implementar seq2seq con y sin atención desde cero y demostrar la mejora con interpretación de alineamientos.
Earning criteria — what you'll demonstrate
- Entender encoder-decoder y mecanismo de atención implementándolos
- Diagnosticar problemas típicos (bucles, copias, EOS prematuro)
- Visualizar e interpretar mapas de atención
- Comparar dos arquitecturas bajo presupuesto controlado
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador/a de Machine Learning
Implementar arquitecturas desde cero y diagnosticarlas es la habilidad central de cualquier persona en investigación ML.
Este proyecto afina
- seq2seq
- attention-mechanism
- pytorch
Ingeniero/a de Procesamiento de Lenguaje Natural
Entender atención antes de usar Transformers es prerrequisito para iterar arquitecturas en NLP de producto.
Este proyecto afina
- seq2seq
- bahdanau-attention
- bleu-evaluation