Agente de soporte que resuelve incidencias de e-commerce
Visión general
De qué trata este proyecto.
Diseñarás un agente con tool use que reciba un ticket entrante, decida qué herramientas invocar (consultar estado de envío, generar etiqueta de devolución, consultar log de pago) y produzca una respuesta o derive a humano. Las herramientas serán mocks deterministas para evaluación. Recibirás 500 tickets reales anotados con la respuesta esperada y la acción esperada. Evaluarás (1) tasa de resolución correcta sobre 500 tickets, (2) tasa de escalado innecesario (escala cuando podría haber resuelto), (3) tasa de alucinación (responde sin invocar la herramienta cuando debería) y (4) coste por ticket. El éxito es resolución correcta superior al 70% en los tickets resolubles con menos del 3% de alucinación.
El Briefing
Lo que harás y lo que demostrarás.
Construir un agente LLM con tool use que resuelva de forma autónoma tickets sencillos con baja tasa de alucinación y derivación útil a humano.
Earning criteria — what you'll demonstrate
- Diseñar la interfaz herramientas-agente con esquemas y descripciones claras
- Construir bucles de razonamiento (ReAct o equivalente) con manejo de errores
- Evaluar agentes con métricas de tarea, no solo de respuesta libre
- Cuantificar coste por interacción y trade-offs con la calidad
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosAI Engineer
Construir agentes con tool use, suite de evaluación y plan de despliegue es exactamente el trabajo de quien ejerce de AI Engineer en producto.
Este proyecto afina
- llm-agents
- tool-use
- python
Prompt Engineer
Iterar prompts del sistema, esquemas de herramientas y trazas de error es el oficio diario de una persona Prompt Engineer en startups con producto LLM.
Este proyecto afina
- prompt-engineering
- llm-agents
- agent-evaluation
Machine Learning Engineer
Definir métricas de tarea, suite de evaluación y monitorización es ingeniería ML aplicada al stack agentic.
Este proyecto afina
- agent-evaluation
- python
- tool-use