QLoRA en GPU Modesta para Lab de Modelos Abiertos en Málaga
Visión general
De qué trata este proyecto.
Recibirás un dataset de instrucciones en castellano (~30.000 ejemplos) y acceso a una RTX 4090 (24GB). Entrena el modelo 13B con (a) QLoRA 4-bit (NF4 + double quantization) y (b) LoRA en 16-bit, ambos sobre los mismos datos y hiperparámetros equivalentes. Mide perplejidad sobre holdout, win-rate pairwise (juicio humano sobre 80 prompts) y coste (GPU-horas + memoria pico). Documenta dónde QLoRA pierde y dónde no. Entrega notebook reproducible, dos adaptadores y un blog post técnico de 1.500-2.000 palabras.
El Briefing
Lo que harás y lo que demostrarás.
Compara QLoRA 4-bit y LoRA 16-bit en calidad y coste sobre la misma receta y publica un blog técnico reproducible.
Earning criteria — what you'll demonstrate
- Aplicar QLoRA con NF4 + double quantization correctamente
- Diseñar un experimento pareado para comparar QLoRA y LoRA
- Realizar evaluación pairwise humana con protocolo justo
- Comunicar resultados técnicos honestos a una comunidad open-source
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosInvestigador en Aprendizaje Automático
Comparaciones pareadas y reproducibles es la rutina del ML Researcher en foundation labs.
Este proyecto afina
- qlora
- experiment-design
- llm-evaluation
Científico en IA Aplicada
Comunicar trade-offs técnicos a una comunidad técnica externa es trabajo central del Applied AI Scientist en open source.
Este proyecto afina
- llm-evaluation
- model-quantization
- experiment-design
Ingeniero NLP
Entrenar y empaquetar adaptadores reproducibles en hardware modesto es trabajo recurrente del NLP Engineer.
Este proyecto afina
- qlora
- lora
- huggingface