Übersicht
Worum es bei diesem Projekt geht.
Sie bekommen einen Datensatz von 200 Stunden Fußballspielen mit zeitstempelten Highlight-Annotationen (Tore, Großchancen, Karten). Implementieren Sie drei Modelle: (1) rein-visuell (CNN auf Frames), (2) rein-akustisch (CNN auf Mel-Spektrogrammen), (3) multimodal mit später Fusion (Konkatenation der Embeddings + Klassifikations-Kopf). Trainieren Sie auf 80 % der Spiele, validieren auf 20 %. Messen Sie F1, Precision@90%-Recall und Highlight-Latenz (Verzögerung zwischen Ereignis und Detection). Liefern Sie einen 6-seitigen Forschungsbericht und einen Inferenz-Service-Prototyp.
Das Briefing
Was Du tust und was Du zeigst.
Wie viel verbessert multimodale Audio-Video-Fusion gegenüber rein-visueller und rein-akustischer Highlight-Detection in Fußballspielen?
Earning criteria — what you'll demonstrate
- Multimodales Lernen mit später Fusion praktisch implementieren
- Audio-Features (Mel-Spektrogramme) für Klassifikation extrahieren
- Live-Stream-Latenz als Engineering-Metrik neben Genauigkeit ernst nehmen
- Drei Modellklassen fair vergleichen, ohne Apples-to-Oranges-Fehler
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenMachine-Learning-Ingenieur:in
Multimodale Modelle mit Live-Inferenz-Anforderung sind ein anspruchsvolles Profil, das Streaming-, Sicherheits- und Robotik-Unternehmen 2026 vermehrt suchen.
Dieses Projekt schärft
- multimodal-fusion
- video-classification
- audio-classification
Computer-Vision-Ingenieur:in
Video-Klassifikation mit zusätzlicher Audio-Spur ist die nächste Ausbaustufe klassischer CV-Arbeit; sie qualifiziert für Senior-Pfade in Video-Plattformen.
Dieses Projekt schärft
- video-classification
- pytorch
- model-evaluation
Angewandte:r KI-Wissenschaftler:in
Drei Modellfamilien fair zu vergleichen und in einen Forschungsbericht zu gießen, ist die Brückenkompetenz, die Applied AI Scientists in produktnahen Teams täglich brauchen.
Dieses Projekt schärft
- multimodal-fusion
- deep-learning
- model-evaluation
Noch eine Sache