Diseña la UX de un producto multimodal de IA para una startup de Ciudad de México
Visión general
De qué trata este proyecto.
Diseña en Figma el flujo de la app: (1) cómo el estudiante elige modalidad de entrada (voz, texto, foto), (2) cómo se muestra la respuesta multimodal, (3) cómo se corrigen errores de comprensión. Prototipa la pieza de backend que recibe los 3 tipos de input y devuelve respuesta unificada usando un modelo multimodal (GPT-4o o equivalente). Ejecuta un mini-estudio con 10 estudiantes (3 tareas cada uno), mide tiempo de éxito y satisfacción. Entrega Figma + backend + rationale de 4 páginas.
El Briefing
Lo que harás y lo que demostrarás.
Diseñar y validar un flujo multimodal voz/texto/imagen que estudiantes puedan usar para tareas escolares, con rationale defendible ante inversores.
Earning criteria — what you'll demonstrate
- Diseñar UX para sistemas multimodales bajo restricciones reales (latencia, fallos)
- Conectar un modelo visión-lenguaje con un flujo de producto consumer
- Validar decisiones de diseño con user research liviano pero honesto
- Comunicar trade-offs UX a inversores con rationale escrito
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosDiseñador/a de Producto de IA
Diseñar UX multimodal con prototipo, backend y rationale para inversores es exactamente el trabajo del AI product designer en consumer-AI.
Este proyecto afina
- ux-design
- product-design
- multimodal-ml
Gerente de Producto de IA
Conectar trade-offs UX con restricciones técnicas y comunicarlos a inversores es competencia del AI PM en startup temprana.
Este proyecto afina
- product-design
- multimodal-ml
- user-research
Ingeniero/a de IA
Construir el backend que recibe los 3 inputs y orquesta la llamada multimodal es trabajo de AI engineer en consumer-AI.
Este proyecto afina
- vision-language-models
- prompt-engineering
- multimodal-ml