Spektrale Clustering-Pipeline für Mittelstands-Kundensegmentierung
Übersicht
Worum es bei diesem Projekt geht.
Konstruiere einen k-Nearest-Neighbor-Graphen auf den 3,2 Mio. Profilen (mit FAISS für die ANN-Suche). Berechne die normalisierte Laplace-Matrix und extrahiere die k kleinsten Eigenvektoren mit einem iterativen Solver (Lanczos via SLEPc oder scipy.sparse.linalg.eigsh). Cluster die Eigen-Embeddings mit K-Means. Vergleiche gegen K-Means und HDBSCAN auf den Rohdaten anhand Silhouette-Score, Cluster-Stabilität über 20 Bootstraps und Geschäfts-Interpretierbarkeit (Marketing-Team-Review von 12 zufälligen Cluster-Profilen). Liefere Code, Vergleichsbericht und Production-Pipeline.
Das Briefing
Was Du tust und was Du zeigst.
Baue eine spektrale Clustering-Pipeline für 3,2 Mio. Datenpunkte, die in unter 4 Stunden auf Standard-Cloud-Hardware konvergiert und stabilere Cluster liefert als K-Means.
Earning criteria — what you'll demonstrate
- Spektrale Clustering-Theorie aus Lehrbuch in skalierbare Pipeline überführen
- Iterative Eigenraum-Solver (Lanczos, Arnoldi) für große sparse Matrizen einsetzen
- kNN-Graph-Konstruktion mit ANN-Strukturen für Millionen-Skala beherrschen
- Cluster-Stabilität methodisch sauber messen und interpretieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNoch eine Sache