Code
Clasificación automática de defectos en informes de calidad de proveedores Tier-1
Visión general
De qué trata este proyecto.
Construye un modelo de clasificación de textos que procese informes de no conformidad en tres idiomas y los clasifique en las 12 categorías de defecto definidas por la empresa. Debes usar técnicas de Procesamiento de Lenguaje Natural (NLP) — campo de la inteligencia artificial que permite a las computadoras entender y generar texto humano — incluyendo representaciones de texto modernas (embeddings contextuales) y, si lo consideras adecuado, un modelo de lenguaje grande (Large Language Model, LLM) como punto de partida. El éxito se mide por: (1) una exactitud (accuracy) mínima del 85% en un conjunto de prueba reservado, (2) una explicación generada automáticamente para cada clasificación que un técnico de calidad pueda validar en menos de 30 segundos, y (3) un informe de riesgos que identifique qué tipos de defecto tienden a confundirse entre sí. Trabajarás con un conjunto de datos anonimizado de 5.000 informes históricos proporcionado por la empresa. No se requiere desplegar el modelo en producción, pero sí documentar cómo se integraría en el flujo de trabajo actual del software de gestión de calidad (Quality Management System, QMS).
El Briefing
Lo que harás y lo que demostrarás.
¿Cómo automatizar la clasificación multilingüe de informes de defectos con suficiente precisión y explicabilidad para que un técnico de calidad confíe en el resultado y reduzca el tiempo de respuesta de 72 a 4 horas?
Earning criteria — what you'll demonstrate
- Aplicar técnicas de vectorización de texto y modelos de lenguaje preentrenados a un problema de clasificación multiclase en contexto industrial
- Evaluar la calidad de un modelo de NLP más allá de la exactitud global, analizando errores por categoría y por idioma
- Diseñar mecanismos de explicabilidad (explainability) que hagan transparentes las decisiones de un modelo de clasificación para usuarios no técnicos
- Documentar una propuesta de integración de Machine Learning en un sistema de gestión empresarial existente
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Ingeniero de NLP
Este reto proporciona experiencia directa en el ciclo completo de desarrollo de un sistema de NLP industrial: desde la limpieza de textos técnicos multilingües hasta la evaluación de calidad y la propuesta de integración en producción, competencias centrales del rol de ingeniero de NLP en equipos de ingeniería de software.
Este proyecto afina
- natural-language-processing
- text-classification
- multilingual-text-processing
Ingeniero de Machine Learning
La necesidad de documentar la arquitectura de despliegue, garantizar la reproducibilidad del entrenamiento y traducir requisitos de negocio en métricas de modelo refleja el día a día de un ingeniero de Machine Learning que opera entre investigación e infraestructura productiva.
Este proyecto afina
- python-programming
- model-explainability
- natural-language-processing
Científico de Datos de IoT
El contexto industrial automotriz, con sus sistemas de gestión de calidad y flujos de datos de sensores y operadores, prepara para roles que combinen análisis de datos con dominio de manufactura y conectividad de planta.
Este proyecto afina
- python-programming
- model-explainability
- text-classification