Multimodale Schadenserkennung fuer einen Versicherer aus Foto + Sprachmemo
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst rund 4 800 anonymisierte Schadenmeldungen: pro Meldung ein JPEG (Schadensfoto) und eine WAV-Datei (Sprachmemo, deutsch). Verarbeite das Foto mit einem vortrainierten Vision-Backbone (z. B. CLIP oder ResNet-50), die Audiodatei mit einem Spracherkennungs-Modell (Whisper) und kombiniere die zwei Repraesentationen in einem kleinen Fusion-Klassifikator. Berichte Genauigkeit pro Klasse + Konfusionsmatrix, fuehre eine Ablation durch (nur Foto / nur Sprache / Fusion) und liefere ein 3-seitiges Memo, das den Mehrwert der Fusion quantifiziert.
Das Briefing
Was Du tust und was Du zeigst.
Klassifiziere Kfz-Bagatellschaeden automatisch aus Foto + Sprachmemo und zeige messbar, dass die Fusion die Einzelmodalitaeten schlaegt.
Earning criteria — what you'll demonstrate
- Multimodale Repraesentationen aus Bild und Sprache verbinden
- Vortrainierte Backbones (CLIP, Whisper) als Feature-Extraktoren einsetzen
- Ablations-Studien als methodischen Standard fuhren
- Den Mehrwert eines komplexeren Modells quantitativ verteidigen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenML Researcher
Multimodale Fusion-Modelle methodisch zu vergleichen ist Tagesgeschaeft fuer ML-Forscher:innen in industriellen Anwendungslaboren der Versicherungs- und Automotive-Branche.
Dieses Projekt schärft
- multimodal-learning
- fusion-models
- model-evaluation
Computer Vision Engineer
Vortrainierte Vision-Backbones fuer industrielle Klassifikations-Aufgaben einzusetzen ist eine zentrale CV-Engineer-Kompetenz.
Dieses Projekt schärft
- computer-vision
- pytorch
- fusion-models
Applied AI Scientist
Den Mehrwert eines komplexeren Modells in Euro Innendienst-Zeit zu uebersetzen, ist die Uebersetzungsleistung des angewandten KI-Bereichs.
Dieses Projekt schärft
- multimodal-learning
- model-evaluation
- speech-recognition
Noch eine Sache