Comparar arquitecturas de gran escala bajo presupuesto fijo
Visión general
De qué trata este proyecto.
Definirás el protocolo experimental: mismo dataset de pre-entrenamiento (un subset abierto, p. ej. SlimPajama 50B tokens), mismo presupuesto en FLOPs, mismo tokenizer. Entrenarás tres variantes de modelo (Llama-style denso, MoE estilo Mixtral pequeño, Mamba-style SSM) con tamaño efectivo equivalente y compararás (1) perplexity en validación, (2) downstream zero-shot en una batería de tareas (HellaSwag, ARC, MMLU-mini), y (3) throughput de inferencia en una GPU A10 y en CPU. El éxito es un informe que la dirección pueda usar para decidir en qué arquitectura invertir el siguiente ciclo.
El Briefing
Lo que harás y lo que demostrarás.
Producir un estudio comparativo interno entre arquitecturas LLM a escala pequeña, bajo presupuesto de FLOPs constante, con métricas de calidad y de inferencia.
Earning criteria — what you'll demonstrate
- Diseñar comparativas justas entre arquitecturas controlando por FLOPs y tokens
- Implementar y depurar entrenamientos distribuidos con paralelismo de datos y, si aplica, de modelo
- Evaluar modelos de lenguaje con baterías zero-shot reproducibles
- Comunicar trade-offs arquitectónicos a una audiencia técnica y a una directiva
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosResearch Scientist
Diseñar un estudio comparativo entre arquitecturas con controles correctos es el oficio nuclear de quien firma papers de scaling laws o de nuevas familias arquitectónicas.
Este proyecto afina
- transformer-architectures
- experimental-design
- state-space-models
ML Researcher
Saber qué reportar y cómo, en una comparativa controlada por FLOPs, es la diferencia entre un experimento publicable y un informe interno sin tracción.
Este proyecto afina
- mixture-of-experts
- experimental-design
- transformer-architectures
Machine Learning Engineer
El reto entrena el músculo de ingeniería que hace que un entrenamiento distribuido no se rompa: throughput, memoria, checkpointing y reproducibilidad.
Este proyecto afina
- distributed-training
- large-scale-training
- transformer-architectures