Skip to contentSkip to content
Verifizierte Zertifikate. On-Chain. Für immer.Mehr erfahren
Cover image for Audio-Video-Fusion für Sport-Highlight-Detektor
Code

Audio-Video-Fusion für Sport-Highlight-Detektor

FreeVerified credential4 WochenAdvanced

Übersicht

Worum es bei diesem Projekt geht.

Sie bekommen einen Datensatz von 200 Stunden Fußballspielen mit zeitstempelten Highlight-Annotationen (Tore, Großchancen, Karten). Implementieren Sie drei Modelle: (1) rein-visuell (CNN auf Frames), (2) rein-akustisch (CNN auf Mel-Spektrogrammen), (3) multimodal mit später Fusion (Konkatenation der Embeddings + Klassifikations-Kopf). Trainieren Sie auf 80 % der Spiele, validieren auf 20 %. Messen Sie F1, Precision@90%-Recall und Highlight-Latenz (Verzögerung zwischen Ereignis und Detection). Liefern Sie einen 6-seitigen Forschungsbericht und einen Inferenz-Service-Prototyp.

CredentialBlockchain-anchored
ShareableLinkedIn-ready
LanguageEnglish
PaceSelf-paced

Das Briefing

Was Du tust und was Du zeigst.

Wie viel verbessert multimodale Audio-Video-Fusion gegenüber rein-visueller und rein-akustischer Highlight-Detection in Fußballspielen?

Earning criteria — what you'll demonstrate

  • Multimodales Lernen mit später Fusion praktisch implementieren
  • Audio-Features (Mel-Spektrogramme) für Klassifikation extrahieren
  • Live-Stream-Latenz als Engineering-Metrik neben Genauigkeit ernst nehmen
  • Drei Modellklassen fair vergleichen, ohne Apples-to-Oranges-Fehler

Studienpassung

Wo dies in Dein Studium passt.

Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.

Fähigkeiten

Fähigkeiten, die Du unter Beweis stellst.

Jede taucht auf Deinem verifizierten Zertifikat auf.

Karrieren

Berufe, auf die dies Dich vorbereitet.

Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.

Karrierewege, die das aufbaut

Kanonische Rollen

Machine-Learning-Ingenieur:in

Multimodale Modelle mit Live-Inferenz-Anforderung sind ein anspruchsvolles Profil, das Streaming-, Sicherheits- und Robotik-Unternehmen 2026 vermehrt suchen.

Dieses Projekt schärft

  • multimodal-fusion
  • video-classification
  • audio-classification

Computer-Vision-Ingenieur:in

Video-Klassifikation mit zusätzlicher Audio-Spur ist die nächste Ausbaustufe klassischer CV-Arbeit; sie qualifiziert für Senior-Pfade in Video-Plattformen.

Dieses Projekt schärft

  • video-classification
  • pytorch
  • model-evaluation

Angewandte:r KI-Wissenschaftler:in

Drei Modellfamilien fair zu vergleichen und in einen Forschungsbericht zu gießen, ist die Brückenkompetenz, die Applied AI Scientists in produktnahen Teams täglich brauchen.

Dieses Projekt schärft

  • multimodal-fusion
  • deep-learning
  • model-evaluation

Noch eine Sache

Du kannst ein Zertifikat bis Freitag in Deinem Lebenslauf haben.