Cross-Modal-Translation für Hamburger Marine-Forschung
Übersicht
Worum es bei diesem Projekt geht.
Sie erhalten 80 Stunden Hydrophon-Aufnahmen mit zeitgestempelten optischen Snapshots, jeder Snapshot manuell in 6 Riff-Zustandsklassen kategorisiert. Trainieren Sie ein Audio-Modell, das aus einem 30-Sekunden-Audio-Fenster die wahrscheinliche Riff-Klasse vorhersagt. Trainieren Sie zusätzlich ein Vision-Baseline-Modell, das aus dem Snapshot direkt klassifiziert. Vergleichen Sie: erreicht das reine Audio-Modell mindestens 70 % der Vision-Genauigkeit? Visualisieren Sie über t-SNE die gelernten Audio-Embeddings nach Klasse. Liefern Sie einen 6-seitigen Forschungsbericht plus Code-Repo.
Das Briefing
Was Du tust und was Du zeigst.
Kann ein audio-basiertes Modell aus Unterwasser-Hydrophon-Aufnahmen den visuell beobachtbaren Riff-Zustand mit mindestens 70 % der Genauigkeit eines reinen Vision-Modells vorhersagen?
Earning criteria — what you'll demonstrate
- Cross-Modal-Learning als Forschungsfrage konzipieren
- Audio-Features (MFCC, Mel-Spektrogramme) für Klassifikation extrahieren
- Repräsentations-Qualität jenseits der Klassifikationsgenauigkeit bewerten (t-SNE)
- Eine Forschungs-Hypothese sauber gegen ein Vision-Baseline testen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenML-Forscher:in
Cross-Modal-Forschung in einer wenig erschlossenen Domäne (Bioakustik) ist ein originelles Profil-Stück, das in interdisziplinären Labs sehr gut ankommt.
Dieses Projekt schärft
- cross-modal-learning
- audio-classification
- representation-learning
Forschungswissenschaftler:in
Eine Hypothese sauber gegen einen Vision-Baseline zu testen und in einen Konferenz-Bericht zu gießen, übt das Format, das Research Scientists in jedem ersten Projekt liefern müssen.
Dieses Projekt schärft
- research-methodology
- evaluation
- representation-learning
Angewandte:r KI-Wissenschaftler:in
Audio-zu-Bild-Klassifikation in einer Forschungsdomäne übersetzt direkt auf industrielle Audio-Anwendungen (Predictive Maintenance, Acoustic Anomaly Detection).
Dieses Projekt schärft
- audio-classification
- pytorch
- evaluation
Noch eine Sache