Reduce dimensionalidad para encontrar perfiles en una bodega de Mendoza
Visión general
De qué trata este proyecto.
Aplica PCA (Principal Component Analysis — análisis de componentes principales) y UMAP (Uniform Manifold Approximation and Projection — aproximación y proyección uniforme de variedades) sobre las features estandarizadas. Selecciona 2D para visualización y k≥6 componentes para clustering. Compara K-Means con un modelo de mezcla gaussiana (GMM). Valida que los clusters se correlacionen con la valoración del enólogo y con la denominación de origen. Entrega 4-6 estilos descritos en lenguaje vinícola.
El Briefing
Lo que harás y lo que demostrarás.
Encontrar 4-6 estilos latentes de vino con reducción de dimensionalidad + clustering que se correlacionen con la valoración del enólogo.
Earning criteria — what you'll demonstrate
- Aplicar y comparar PCA y UMAP con criterios cuantitativos
- Distinguir K-Means de GMM en datos con clusters de tamaño desigual
- Validar clustering contra una variable externa (valoración del enólogo)
- Traducir componentes latentes a descripciones interpretables
Encaje académico
Dónde encaja esto en tus estudios.
Afina las mismas habilidades que tu titulación espera de ti.
Habilidades
Habilidades que demostrarás.
Cada una aparece en tu credencial verificada.
Carreras
Roles para los que esto te prepara.
Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.
Trayectorias profesionales que esto construye
Roles canónicosCientífico de Datos
Reducción de dimensionalidad + clustering interpretado es el patrón de exploración inicial en cualquier proyecto de data science con datos densos.
Este proyecto afina
- dimensionality-reduction
- pca
- unsupervised-learning
Investigador/a de Machine Learning
Comparar PCA y UMAP con sensibilidad a hiperparámetros es el tipo de rigor metodológico esperado en investigación aplicada.
Este proyecto afina
- dimensionality-reduction
- umap
- gaussian-mixture-models
Científico/a de IA Aplicada
Traducir componentes latentes a fichas accionables para sumiller es el puente entre método y producto que define el rol.
Este proyecto afina
- pca
- unsupervised-learning
- dimensionality-reduction